분류 전체보기153 [Pandas] 유일한 값 찾기 unique(), nunique(), value_counts() 데이터 분석을 하면서 우리는 유일한 값, 즉 고유한 값을 찾고 싶은 순간들이 있습니다. 이번 시간에는 그 종류들에 대해 알아보도록 하겠습니다. 제가 정리할 방법은 총 3가지 입니다. 3가지의 특징들을 잘 파악해서 필요한 경우에 맞는 고유값을 출력하도록 도움이 되면 좋겠습니다. 예제로 사용해볼 데이터는 다음과 같습니다. 데이터 중 Item은 빵가게에서 판매하는 품목들의 종류를 의미합니다. 품목들의 고유한, 유일한 값을 알아보도록 하겠습니다. 1. unique() unique()는 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수입니다. 예시로 설명을 해보도록 하겠습니다. 출력된 결과를 보면 품목들의 종류들이 고유한 값으로 출력된 것을 볼 수 있습니다. 데이터의 종류들을 알고 싶을때 사용.. 2021. 2. 2. 추천시스템(Recommender System) 넷플릭스나 유튜브를 보면 나에게 맞는 영화나 영상을 추천해 줍니다. 유튜브를 보면서 유튜브 알고리즘 정말 대단하다...라는 말을 많이 한적이 있습니다. 어떻게 나에게 맞는 영상들을 잘 찾아 추천해줄까?? 하는 궁금증을 시작으로 추천 시스템에 대해 알아보고자 합니다. 추천 시스템(Recommender System)이란? 추천 시스템은 정보 필터링중 하나로 특정 사용자가 관심을 가질만한 정보 (영화, 음악, 책, 뉴스, 이미지, 웹 페이지 등)를 추천하는 시스템입니다. 사람들이 많이 사용하는 넷플릭스, 인스타그램, 페이스북, 유튜브등에 모두 추천 시스템이 활용되고 있습니다. - 위키백과 참고- 추천 시스템 유형 - 협업 필터링(Collaborative Filtering) 협업 필터링은 많은 사용자들에게 얻은.. 2021. 1. 27. [Python] 결측치/결측값 확인 missingno EDA를 하는 과정에서 데이터의 결측치/결측값을 확인하는 것은 매우 중요합니다. 결측치를 파악하기 쉽게 시각화 해주는 라이브러리가 있어 정리하고자 합니다.missingno(1) msno.bar import missingno as msno msno.bar(df=data.iloc[:, :], color=(0.1, 0.6, 0.8)) msno.bar는 막대그래프 형태로 시각화를 해주는 함수입니다. (2) msno.matrix import missingno as msno msno.matrix(df=data.iloc[:, :], color=(0.1, 0.6, 0.8)) msno.matrix는 매트릭스 형태로 결측치를 시각화 합니다. 흰색으로 표현된 빈칸들이 결측치를 의미합니다. 2021. 1. 25. selenium 내장함수 동적크롤링을 하기 위해 필요한 selenium 내장함수에 대해 알아보겠습니다. driver = webdriver.Chrome('./chromedriver') 먼저 다음과 같이 driver를 정의하여 줍니다. path설정을 주의해야 합니다. 1. get() get() 함수는 입력한 url 주소로 접속하게 해주는 함수입니다. 사용법은 다음과 같습니다. driver.get("url 주소") 2. find_element_by_ ~ () 이 함수는 정적크롤링의 find()와 비슷한 역할을 하는 함수로 HTML 요소를 찾는 함수입니다. find_element_by_는 종류가 굉장히 많기 때문에 ~로 표시하였습니다. 많은 종류 중 몇가지만 살펴보도록 하겠습니다. - find_element_by_css_selector.. 2021. 1. 25. 이전 1 ··· 17 18 19 20 21 22 23 ··· 39 다음