본문 바로가기
Machine Learning

회귀 평가 지표

by rubyda 2020. 5. 27.
728x90

회귀의 평가를 위한 지표는 실제 값과 예측값의 차이를 기반으로 이루어집니다. MAE, MSE, RMSE, RMSLE등은 값이 작을수록 좋고 R²은 값이 클수록 좋습니다.

 

 

회귀 평가 지표 종류


MAE (Mean Absolue Error) :

실제 값과 예측값의 차이를 절댓값으로 변환하여 평균한 것입니다.

$$ MAE = \frac{1}{n}\sum_{i=1}^{n}|Yi-\hat{Y}i|$$

 

MSE (Mean Squared Error):

실제 값과 예측값의 차이를 제곱해 평균한 것입니다.

$$ MSE = \frac{1}{n}\sum_{i=1}^{n}(Yi-\hat{Y}i)^2$$

 

RMSE (Root Mean Squared Error):

MSE값은 오류의 제곱을 구하는것이기 때문에 실제 오류 평균보다 더 커지는 특성이 있어 MSE에 루트를 씌운 것이 바로 RMSE입니다.

$$ RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(Yi-\hat{Y}i)^2}$$

 

RMSLE (Root Mean Squared Log Error)

RMSE에 로그를 씌운 것입니다.

$$ RMSLE= \sqrt{\frac{1}{n}\sum_{i=1}^{n}(log(y_{i}+1)-log(y\hat{}_{i}+1))^2}$$

 

R²:

분산을 기반으로 예측 성능을 평가하며 1에 가까울수록 예측 정확도가 높습니다.

$$ R^{2} = \frac{예측값 Variance}{실제값 Variance}$$

 

 

RMSE와 RMSLE 비교


 

RMSLE는 RMSE와 다르게 실제 값과 관련된 오차에 벌점을 부과하기 때문에 이상값에 덜 민감하다는 장점이 있습니다.

 

또한 RMSEL는 과대성능보다는 과소 성능에 더 많이 신경을 쓰기 때문에 많이 과하게 과대하려는 예측의 경우 RMSE보다는 RMSLE가 더 유용합니다.

 

 

 

Reference


파이썬 머신러닝 완벽가이드