728x90
EDA를 하는 과정에서 데이터의 결측치/결측값을 확인하는 것은 매우 중요합니다. 결측치를 파악하기 쉽게 시각화 해주는 라이브러리가 있어 정리하고자 합니다.
missingno(1) msno.bar
import missingno as msno msno.bar(df=data.iloc[:, :], color=(0.1, 0.6, 0.8))
msno.bar는 막대그래프 형태로 시각화를 해주는 함수입니다.
(2) msno.matrix
import missingno as msno msno.matrix(df=data.iloc[:, :], color=(0.1, 0.6, 0.8))
msno.matrix는 매트릭스 형태로 결측치를 시각화 합니다. 흰색으로 표현된 빈칸들이 결측치를 의미합니다.
'Python' 카테고리의 다른 글
[Pandas] Pandas Cheat Sheet (Creating DataFrames) (0) | 2021.05.16 |
---|---|
[Pandas] Pandas Cheat Sheet (판다스 치트 시트) (1) | 2021.05.16 |
[Pandas] 유일한 값 찾기 unique(), nunique(), value_counts() (4) | 2021.02.02 |
Dataframe 전체 행과 열 출력하기 (0) | 2021.01.21 |
정규표현식(regular expression) (0) | 2020.08.15 |