회귀의 평가를 위한 지표는 실제 값과 예측값의 차이를 기반으로 이루어집니다. MAE, MSE, RMSE, RMSLE등은 값이 작을수록 좋고 R²은 값이 클수록 좋습니다.
회귀 평가 지표 종류
MAE (Mean Absolue Error) :
실제 값과 예측값의 차이를 절댓값으로 변환하여 평균한 것입니다.
$$ MAE = \frac{1}{n}\sum_{i=1}^{n}|Yi-\hat{Y}i|$$
MSE (Mean Squared Error):
실제 값과 예측값의 차이를 제곱해 평균한 것입니다.
$$ MSE = \frac{1}{n}\sum_{i=1}^{n}(Yi-\hat{Y}i)^2$$
RMSE (Root Mean Squared Error):
MSE값은 오류의 제곱을 구하는것이기 때문에 실제 오류 평균보다 더 커지는 특성이 있어 MSE에 루트를 씌운 것이 바로 RMSE입니다.
$$ RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(Yi-\hat{Y}i)^2}$$
RMSLE (Root Mean Squared Log Error)
RMSE에 로그를 씌운 것입니다.
$$ RMSLE= \sqrt{\frac{1}{n}\sum_{i=1}^{n}(log(y_{i}+1)-log(y\hat{}_{i}+1))^2}$$
R²:
분산을 기반으로 예측 성능을 평가하며 1에 가까울수록 예측 정확도가 높습니다.
$$ R^{2} = \frac{예측값 Variance}{실제값 Variance}$$
RMSE와 RMSLE 비교
RMSLE는 RMSE와 다르게 실제 값과 관련된 오차에 벌점을 부과하기 때문에 이상값에 덜 민감하다는 장점이 있습니다.
또한 RMSEL는 과대성능보다는 과소 성능에 더 많이 신경을 쓰기 때문에 많이 과하게 과대하려는 예측의 경우 RMSE보다는 RMSLE가 더 유용합니다.
Reference
'Machine Learning' 카테고리의 다른 글
회귀 실습 - (자전거 대여 수요 예측) (0) | 2020.05.28 |
---|---|
회귀 실습 - (자전거 대여 수요 예측) (0) | 2020.05.28 |
로지스틱 회귀 (2) | 2020.05.27 |
규제 선형 모델 (0) | 2020.05.27 |
LinearRegression 실습( 주택 가격 예측) (0) | 2020.05.27 |