R
[R] 산점도 그래프: geom_point() vs geom_jitter()
rubyda
2021. 9. 30. 21:03
728x90
두 변수의 상관관계를 알아보기 위한 시각화로 산점도가 있다. R에서는 geom_point() , geom_jitter() 두가지가 있는데 차이점을 정리해보자.
먼저 예제로 사용한 데이터는 moderndive 패키지에 있는 evals 데이터로 6명의 학생들로 구성된 패널에게 설문조사를 진행한 데이터이다. 그 중 강사들의 미모를 평가한 뷰티 점수와 교육 점수에 관계에 대해 알아보자.
geom_point()
# Scatterplot
ggplot(evals, aes(x = bty_avg, y = score)) +
geom_point() +
labs(x = "beauty score", y = "teaching score")
geom_point()는 값들을 반올림하여 시각화를 하는 특징이있다. 점들이 겹치는 것을 방지하기 위해서라고 한다.
실제 값을 좀 더 정확하게 알고 싶다면?? 이때 사용할 수 있는 함수가 geom_jitter()이다.
geom_jitter()
# Jitter plot
ggplot(evals, aes(x = bty_avg, y = score)) +
geom_jitter() +
labs(x = "beauty score", y = "teaching score")
조금 더 가독성이 있다!
참고