본문 바로가기
공부/머신러닝

Regression(회귀) Metric

by ctrlab 2025. 5. 25.

머신러닝 회귀 문제에서는 모델이 예측한 값과 실제 값 사이의 차이를 기반으로 성능을 평가한다. 회귀는 결과가 연속적인 숫자이기 때문에, 분류와는 다른 평가지표(metric)를 사용한다. 대표적인 회귀 메트릭으로는 MAE, MSE, RMSE, R² (R-squared) 등이 있다.

1. MAE (Mean Absolute Error)

MAE는 예측값과 실제값 사이의 절대값 차이의 평균이다. 오차를 직관적으로 해석할 수 있고, 이상치에 덜 민감하다.

$$\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$$

2. MSE (Mean Squared Error)

MSE는 예측값과 실제값의 차이를 제곱해서 평균을 낸 것이다. 큰 오차에 더 큰 벌점을 주기 때문에, 이상치에 민감하다.

$$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$$

3. RMSE (Root Mean Squared Error)

RMSE는 MSE에 루트를 씌운 것으로, 원래 데이터 단위와 같아져서 해석이 더 쉽다.

$$\text{RMSE} = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 }$$

4. R² Score (결정계수)

R²는 모델이 실제값의 분산을 얼마나 잘 설명하는지를 나타내는 지표다. 1에 가까울수록 예측력이 좋고, 0이면 평균으로 예측한 것과 같으며, 음수도 가능하다 (엉뚱한 예측).

$$R^2 = 1 - \frac{ \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 }{ \sum_{i=1}^{n} (y_i - \bar{y})^2 }$$

여기서:
- $y_i$는 실제값
- $\hat{y}_i$는 예측값
- $\bar{y}$는 실제값의 평균

각 메트릭은 서로 다른 성격을 가지고 있으며, 문제의 특성에 따라 적절한 지표를 선택하는 것이 중요하다.

- MAE는 안정적이고 직관적
- MSE는 큰 오차를 더 크게 평가
- RMSE는 해석 용이
- R²는 예측력이 전반적으로 얼마나 우수한지 평가

실무에서는 RMSE와 R²를 함께 보고, 이상치가 많을 땐 MAE도 고려하는 것이 일반적이다.

'공부 > 머신러닝' 카테고리의 다른 글

LSA (Latent Semantic Analysis)  (0) 2025.05.27
Classification(분류) Metric  (0) 2025.05.25