본문 바로가기

Data Analysis7

연관규칙분석(Apriori 알고리즘) 추천시스템에 관심을 가지게 되면서 추천시스템에 배경에 대해 알게되었습니다. 지금은 딥러닝을 이용하는 많은 알고리즘이 나왔지만 오늘은 추천시스템의 1세대라고 할 수 있는 Apriori 알고리즘에 대해서 정리하고자 합니다. 우리는 연관규칙을 할때 효율적으로 탐색하는것이 중요합니다. 왜일까요?? 연관규칙의 개수는 Item 개수가 증가함에 따라서 지수적으로 증가하게 됩니다. 우리는 Item 수가 10개만 된다고 해도 규칙은 57002개가 생성이 됩니다. 즉 계산량이 엄청 복잡해지고 많아지게 되며 시간 또한 오래 걸리게 됩니다. 이러한 경우를 대비하여 "평가 측도"를 기준으로 계산량과 속도를 줄일 수 있습니다. 연관규칙에 관한 글은 다음글에서 https://jaaamj.tistory.com/113 확인할 수 있습.. 2021. 2. 4.
연관분석(Association Analysis)과 평가 측도 연관분석(Association Analysis)이란? 룰기반의 모델로 상품과 상품사이에 어떤 연관이 있는지 찾아내는 알고리즘입니다. 여기서 말하는 연관이란?? - 얼마나 같이 구매가 되지? - A아이템을 구매하면 B아이템을 구매하는가?? 다음 두가지 정도로 생각해볼 수 있습니다. 연관분석은 어떤 상품들이 한 장바구니 안에 담기는지 살피는지 모습과 비슷하기 때문에 장바구니 분석이라고 표현하기도 합니다. 가장 유명한 사례로 월마트 사례가 있습니다. 월마트에서는 맥주를 구매할때 기저귀를 같이 구매한다는 규칙을 발견해서 둘을 함께 진열하는 전략을 세웠다고 합니다. 이런 연관분석을 측정하기 위해서는 평가지표들이 필요합니다. 평가지표에는 지지도, 신뢰도, 향상도가 있습니다. 이 3가지에 대해 알아보도록 하겠습니다... 2021. 2. 3.
플랜잇 태블로 기초 교육 후기 플랜잇 소개 플랜잇은 데이터분석, 머신러닝, AI, 헬스케어, 교육등 다양한 분야의 기업 데이터를 활용하여 가치있는 서비스를 제공해주는 기업입니다. 오랜동안 기업 데이터를 이용하여 가치있는 서비스를 제공하고 있습니다. 특히 플랜잇은 데이터시각화 솔루션태블로 공식 리셀러업체로 시각화의 특화된 기업입니다. 플랜잇에서는 태블로와 관련하여 단계별로 강의를 제공하고 있습니다. 그 강의들중에서 기초 과정과 관련하여 후기를 남기고자 합니다. 교육 선택 이유 대학교에서 태블로를 배웠었지만 데이터를 시각화할때 태블로 보다는 파이썬이나 R을 많이 사용했었습니다. 하지만 캐글 설문조사 결과에서도 그렇고, 실제 비즈니스에서 태블로를 사용하는글을 많이 봤습니다. 그래서 다시 태블로로 데이터를 분석하고 시작해보려 하니 어려움이 .. 2021. 1. 25.