데이터 분석을 하면서 우리는 유일한 값, 즉 고유한 값을 찾고 싶은 순간들이 있습니다. 이번 시간에는 그 종류들에 대해 알아보도록 하겠습니다. 제가 정리할 방법은 총 3가지 입니다. 3가지의 특징들을 잘 파악해서 필요한 경우에 맞는 고유값을 출력하도록 도움이 되면 좋겠습니다.
예제로 사용해볼 데이터는 다음과 같습니다. 데이터 중 Item은 빵가게에서 판매하는 품목들의 종류를 의미합니다. 품목들의 고유한, 유일한 값을 알아보도록 하겠습니다.
1. unique()
unique()는 데이터에 고유값들이 어떠한 종류들이 있는지 알고 싶을때 사용하는 함수입니다. 예시로 설명을 해보도록 하겠습니다.
출력된 결과를 보면 품목들의 종류들이 고유한 값으로 출력된 것을 볼 수 있습니다. 데이터의 종류들을 알고 싶을때 사용하면 유용한 함수입니다.
2. nunique()
nunique()는 데이터에 고유값들의 수를 출력해주는 함수입니다. 예시로 설명을 해보도록 하겠습니다.
출력된 결과를 보면 품목들의 수를 알려주고 있습니다. 데이터의 고유값의 총 수를 알고 싶을때 유용한 함수입니다.
3. value_counts()
value_counts()는 값별로 데이터의 수를 출력해주는 함수입니다. 예시로 설명을 해보도록 하겠습니다.
품목별로 데이터의 갯수를 출력해주고 있습니다. 데이터의 고유값별로 몇개씩 들어있는지 알고 싶을때 유용한 함수입니다.
추가적으로 value_counts()는 기본적으로 내림차순으로 정렬을 해주게 됩니다. 따라서 오름차순으로 정렬을 하고 싶다면 ascending=True 옵션을 지정해 주면 됩니다.
'Python' 카테고리의 다른 글
[Pandas] Pandas Cheat Sheet (Creating DataFrames) (0) | 2021.05.16 |
---|---|
[Pandas] Pandas Cheat Sheet (판다스 치트 시트) (1) | 2021.05.16 |
[Python] 결측치/결측값 확인 missingno (0) | 2021.01.25 |
Dataframe 전체 행과 열 출력하기 (0) | 2021.01.21 |
정규표현식(regular expression) (0) | 2020.08.15 |