➕ Data Science/▹ ML

3. 추천시스템 기초

Ardor924 2025. 6. 4. 17:25

추천시스템 기초

🔶 추천시스템
🔶 콘텐츠기반 필터링을 활용한 음악추천 시스템구현

◻ 데이터전처리
◽ 결측치제거,특수문자 제거
◽ 형태소분석, 어간추출,정규화,불용화처리

◻ 임베딩
◽ 문서태깅
◽ Doc2vec 학습

◻ 유사도계산
◽ 가사기반 유사도 계산
◽ 년도기반 유사도 계산
◽ 가수 기반 유사도 계산
◽ 가산,년도,가수에 가중치 적용한 최종 유사도 계산
![[Screenshot_487.png]]

🔶추천시스템 사례
◻ e-commerce: 쿠팡과 같은 온라인 쇼핑몰에서 고객의 구매 이력과 검색 이력을 바탕으로 제품을 추천
◻ 스트리밍 서비스: 넷플릭스, 유튜브, 스포티파이 등에서 사용자의 시청/청취 이력을 바탕으로 영화, 동영상, 음악을 추천
◻ 뉴스 포털: 사용자가 관심을 가질 만한 뉴스 기사를 추천

🔶추천시스템 종류
![[Screenshot_488.png]]


콘텐츠기반, 기억기반, 아이템기반 방법을 실습할 예정

◻ 1. 콘텐츠 기반 필터링
![[Screenshot_489 1.png]]


◽사용자가 특성 콘텐츠를 선호한다면 유사한 콘텐츠를 추천해주는 방식
◽ 유사도 기반으로 쉽게 구현 가능
◽예) 사용자가 A 영화에 높은 평점을 주었다면 다른 액션 영화를 추천
◻ 2. 협업 필터링
◽기억 기반 (Memorial Based) 또는 최근접 이웃 (Nearest Neighbor) 기반
ㄴ사용자 기반 (User Based)
ㄴ아이템 기반 (Item Based)
◽모델기반 협업 필터링
ㄴ 잠재 요인 (Latent Factor) 협업 필터링 → 행렬 인수분해
ㄴ ML & DL 포함
◻ 3. 하이브리드 방식
◽ 추천 시스템 초창기 : 콘텐츠기반 최근접 이웃 기반 협업 필터링이 주로 사용됨
◽ 넷플릭스 추천 시스템 경연대회에서 잠재 요인 협업 필터링 방식이 우승 하면서 많은 추천 시스템의 대중화
◽ 서비스하는 아이템 특성에 따라 콘텐츠 기반이나 최근접 이웃 기반을 유지하는 사이트도 존재
◽ 요즘에는 "개인화 특성을 좀 더 강화"하기 위한 "하이브리드 형식(콘텐츠와 협업을 적절히 결합)"이나 "딥러닝 기반"이 많이 활용