본문 바로가기

R8

[R] 산점도 그래프: geom_point() vs geom_jitter() 두 변수의 상관관계를 알아보기 위한 시각화로 산점도가 있다. R에서는 geom_point() , geom_jitter() 두가지가 있는데 차이점을 정리해보자. 먼저 예제로 사용한 데이터는 moderndive 패키지에 있는 evals 데이터로 6명의 학생들로 구성된 패널에게 설문조사를 진행한 데이터이다. 그 중 강사들의 미모를 평가한 뷰티 점수와 교육 점수에 관계에 대해 알아보자. geom_point() # Scatterplot ggplot(evals, aes(x = bty_avg, y = score)) + geom_point() + labs(x = "beauty score", y = "teaching score") geom_point()는 값들을 반올림하여 시각화를 하는 특징이있다. 점들이 겹치는 것을 .. 2021. 9. 30.
[R] 통계 모형 깔끔하게 출력하기(broom) 지금까지 공부를 하면서는 다음과 같이 모델을 생성하고 평가하는데 summary() 함수를 많이 사용했다. 회귀분석을 예시로 생각해보자. 회귀분석 후에 우리는 예측 값, 잔차, r.squared등 살펴봐야 할 값들이 많다. m|t|) (Intercept) -17.5791 6.7584 -2.601 0.0123 * speed 3.9324 0.4155 9.464 1.49e-12 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 15.38 on 48 degrees of freedom Multiple R-squared: 0.6511,Adjusted R-squared: 0.6438 F-statist.. 2021. 9. 17.
[R] ggplot2: facet_wrap(집단별로 분할하여 시각화 하기) head(taiwan_real_estate) dist_to_mrt_m n_convenience house_age_years price_twd_msq 1 84.87882 10 30 to 45 11.467474 2 306.59470 9 15 to 30 12.768533 3 561.98450 5 0 to 15 14.311649 4 561.98450 5 0 to 15 16.580938 5 390.56840 5 0 to 15 13.040847 6 2175.03000 3 0 to 15 9.712557 위 데이터는 대만 부동산 데이터이다. 연령대별로 price_twd_msq (주택 가격)을 시각화 하려고 한다. # Using taiwan_real_estate, plot price_twd_msq ggplot(taiwa.. 2021. 9. 1.
[R] with 함수 with() with( ) 함수는 데이터 프레임 또는 리스트 변수를 변수 이름만으로 접근할 수 있게 해주는 함수입니다. 사용 방법 with(data, expr, ...) 사용방법은 다음과 같습니다. data에 원하는 데이터를 넣어주고, expr에는 적용할 함수를 넣어주면 됩니다. 예제 with(iris, { print(mean(Sepal.Length)) print(mean(Sepal.Width)) }) 장점 with 함수를 잘 활용하면 코드줄의 수를 줄일 수 있겠습니다. 2021. 4. 19.