본문 바로가기
R

[R] 산점도 그래프: geom_point() vs geom_jitter()

by rubyda 2021. 9. 30.
728x90

두 변수의 상관관계를 알아보기 위한 시각화로 산점도가 있다.  R에서는 geom_point() , geom_jitter() 두가지가 있는데 차이점을 정리해보자.

 

먼저 예제로 사용한 데이터는 moderndive 패키지에 있는 evals 데이터로 6명의 학생들로 구성된 패널에게 설문조사를 진행한 데이터이다. 그 중 강사들의 미모를 평가한 뷰티 점수와 교육 점수에 관계에 대해 알아보자.

 

geom_point()

# Scatterplot
ggplot(evals, aes(x = bty_avg, y = score)) +
  geom_point() +
  labs(x = "beauty score", y = "teaching score")

geom_point()는 값들을 반올림하여 시각화를 하는 특징이있다. 점들이 겹치는 것을 방지하기 위해서라고 한다.

실제 값을 좀 더 정확하게 알고 싶다면?? 이때 사용할 수 있는 함수가 geom_jitter()이다.

 

geom_jitter()

# Jitter plot
ggplot(evals, aes(x = bty_avg, y = score)) +
  geom_jitter() + 
  labs(x = "beauty score", y = "teaching score")

 

조금 더 가독성이 있다!

 

 

 

참고


https://wikidocs.net/59422