728x90
두 변수의 상관관계를 알아보기 위한 시각화로 산점도가 있다. R에서는 geom_point() , geom_jitter() 두가지가 있는데 차이점을 정리해보자.
먼저 예제로 사용한 데이터는 moderndive 패키지에 있는 evals 데이터로 6명의 학생들로 구성된 패널에게 설문조사를 진행한 데이터이다. 그 중 강사들의 미모를 평가한 뷰티 점수와 교육 점수에 관계에 대해 알아보자.
geom_point()
# Scatterplot
ggplot(evals, aes(x = bty_avg, y = score)) +
geom_point() +
labs(x = "beauty score", y = "teaching score")
geom_point()는 값들을 반올림하여 시각화를 하는 특징이있다. 점들이 겹치는 것을 방지하기 위해서라고 한다.
실제 값을 좀 더 정확하게 알고 싶다면?? 이때 사용할 수 있는 함수가 geom_jitter()이다.
geom_jitter()
# Jitter plot
ggplot(evals, aes(x = bty_avg, y = score)) +
geom_jitter() +
labs(x = "beauty score", y = "teaching score")
조금 더 가독성이 있다!
참고
'R' 카테고리의 다른 글
[R] 통계 모형 깔끔하게 출력하기(broom) (0) | 2021.09.17 |
---|---|
[R] ggplot2: facet_wrap(집단별로 분할하여 시각화 하기) (0) | 2021.09.01 |
[R] with 함수 (0) | 2021.04.19 |
[R] gregexpr, regmatches(패턴 추출) (0) | 2021.04.12 |
[R] assign(객체 생성), get(변수 불러오기) (0) | 2021.04.12 |