넷플릭스나 유튜브를 보면 나에게 맞는 영화나 영상을 추천해 줍니다. 유튜브를 보면서 유튜브 알고리즘 정말 대단하다...라는 말을 많이 한적이 있습니다. 어떻게 나에게 맞는 영상들을 잘 찾아 추천해줄까?? 하는 궁금증을 시작으로 추천 시스템에 대해 알아보고자 합니다.
추천 시스템(Recommender System)이란?
추천 시스템은 정보 필터링중 하나로 특정 사용자가 관심을 가질만한 정보 (영화, 음악, 책, 뉴스, 이미지, 웹 페이지 등)를 추천하는 시스템입니다. 사람들이 많이 사용하는 넷플릭스, 인스타그램, 페이스북, 유튜브등에 모두 추천 시스템이 활용되고 있습니다.
- 위키백과 참고-
추천 시스템 유형
- 협업 필터링(Collaborative Filtering)
협업 필터링은 많은 사용자들에게 얻은 기호 정보에 따라서 사용자들에게 추천해주는 방법입니다. 여기서 핵심 포인트는 사용자들로부터 얻은 정보를 바탕으로 사용자들에게 추천해준다 입니다.
협업 필터링에는 두가지 종류가 있습니다.
(1) 사용자 기반 추천
취향이 비슷한 사용자들을 그룹화하여 그 상품을 추천해주는 방법입니다.
예시로 설명을 해보겠습니다. 만약 철수가 라면, 만두, 김치를 구매를 하였고 영희가 라면, 만두를 구매했다고 가정을 해봅시다. 사용자 기반에 의하면 철수와 영희는 만두, 김치를 동일하게 구매하여 비슷한 사람이라고 인식을 하고 영희에게 김치를 추천하게 됩니다.
(2) 아이템 기반 추천
과거의 구매했던 아이템을 기반으로 그 아이템들과 연관이 높은 다른 아이템들을 추천해주는 방법입니다.
예시로 설명을 해보겠습니다. 사람들은 비빔면과 삼겹살을 같이 구매하는 경우가 많다고 했을때 아이템 기반에 의하면 비빔면을 구매하는 사람들에게 삼겹살을 추천하게 됩니다.
- 콘텐츠 기반 필터링(Content-based Filtering)
콘텐츠 기반 필터링은 말 그대로 콘텐츠에 의해 추천해주는 방법입니다. 즉, 항목 자체를 분석합니다. 예를 들어 음악을 추천해준다고 한다면 음악 자체를 분석합니다. 신곡이 나왔다고 하면 신곡의 비트, 목소리, 장르 등을 분석합니다. 그 다음 사용자가 좋아하는 음악을 분석하여 두개를 비교하면서 사용자에게 맞는 음악을 추천하게 됩니다.
추천 시스템의 한계
추천시스템에도 한계점이 존재합니다. 각각의 종류마다 어떠한 한계의 차이가 존재하는지 알아보도록 하겠습니다.
- 협업 필터링(Collaborative Filtering)의 한계
(1) 콜드 스타트
콜드 스타트란 앞의 결과를 이용하여 동작하므로 데이터가 없는 상태에서는 제대로 동작하지 않는 상황을 말합니다.
협업 필터링은 사용자들의 데이터를 기반으로 하기 때문에 신규 사용자에게는 아무런 정보가 없어 추천을 할 수 없는 상황이 발생하게 됩니다.
(2) 계산 효율의 저하
협업 필터링은 상당히 많은 계산량을 요구합니다. 사용자의 수가 많을 수록 그 계산시간이 더 길어지게 됩니다.
사용자들의 수가 많아 데이터가 많이 쌓이게 되면 정확도는 높일수도 있겠지만 그만큼 시간이 너무 많이 걸려 효율성이 떨어진다는 단점이 있습니다.
(3) 롱테일
사용자들이 소수의 인기 있는 항목에만 관심을 보여서 관심이 저조한 항목은 추천되지 못하는 문제점을 말합니다. 즉 소수의 인기 콘텐츠가 전체 추천 콘첸츠의 비율을 차지하는 "비대칭척 쏠림 현상"이 나타나게 됩니다.
- 콘텐츠 기반 필터링(Content-based Filtering)의 한계
콘텐츠 기반 필터링은 내용 자체를 분석하기 때문에 협업 필터링의 한계인 콜드 스타트 문제를 해결할 수 있는 큰 장점이 있습니다. 하지만 예를 들어 음악, 사진, 영상을 동시에 추천해야 한다고 가정을 해봅시다. 이러한 경우에는 각 항목에서 추출할 수 있는 정보가 다 다르게 됩니다. 그렇기 때문에 프로파일을 구성하기 어려워지게 됩니다. 즉 다양한 형식의 항목을 추천하기에는 어렵다는 단점이 있습니다.
참고
www.samsungsemiconstory.com/2265
blog.skby.net/%ED%98%91%EC%97%85-%ED%95%84%ED%84%B0%EB%A7%81-collaborative-filtering/
'추천시스템' 카테고리의 다른 글
하이브리드 추천 시스템(Hybrid Recommender System) (0) | 2021.03.22 |
---|---|
추천시스템 글 (0) | 2021.03.21 |
추천시스템 활용 예시 (0) | 2021.03.16 |