Machine Learning & DeepLearning

머신러닝 성능 평가 지표(Machine Learning Evaluation Metric) (2) - 회귀 성능 평가 지표

gellygelly 2022. 5. 2. 19:46

회귀 평가 지표

회귀의 평가를 위한 지표는 실제 값과 회귀 모델의 예측 값의 차이를 기반으로 한 지표가 중심이다. 

이 차이 값은 단순 더하기, 빼기로는 +, -가 섞여 오류가 상쇄되므로 보통 절댓값 평균, 제곱, 루트 등을 이용한다. 

 

 

숫자가 작을수록(0에 가까울수록) 좋은 성능 지표 MAE, MSE, RMSE, MSLE, RMSLE
숫자가 클수록(1에 가까울수록) 좋은 성능 지표 R^2

 

회귀 평가 지표 사이킷런 API

평가 방법 사이킷런 평가 지표 API scoring 함수 적용 값
MAE metrics.mean_absolute_error 'neg_mean_absolute_error'
MSE metrics.mean_squared_error 'neg_mean_squared_error'
R^2 metrics.r2_score 'r2'

참고로, RMSE는 MSE에 직접 루트를 씌워서 계산해야 한다. 

 

주의할 점은 scoring 함수 적용 값이 음수로 나온다는 점이다(neg_ 접두어!).

 

이는 일반적인 성능 평가 지표의 경우, 값이 높을수록 좋은 성능임을 나타내지만 회귀의 경우 값이 낮으면 낮을수록 좋은 성능을 의미하기 때문에 -1 값을 곱해 음수로! 변환하기 때문이다.