详细解释:
-
R²:用来衡量模型对数据变异的解释能力。较高的R²表示模型能较好地解释数据的变异,但它并不能直接反映预测误差的大小。
-
MSE:计算的是预测值与实际值之间误差的平方的平均值,因此MSE会放大较大误差的影响,使得对离群点非常敏感。
-
RMSE:是MSE的平方根,保持了MSE强调大误差的优点,同时与数据原始单位一致,使得误差更具解释性。
-
MAE:计算误差的绝对值平均,相比MSE和RMSE,它对异常值不敏感,更平滑地反映误差的大小。但它忽略了误差的平方,不能像MSE那样强调大误差的影响。
以下是R²、MSE、RMSE、MAE之间的区别对比表:
指标 | 全称 | 公式 | 解释 | 取值范围 | 优点 | 缺点 |
---|---|---|---|---|---|---|
R² | 决定系数 (Coefficient of Determination) | R 2 = 1 − SS res SS tot R^2 = 1 - \frac{\text{SS}_{\text{res}}}{\text{SS}_{\text{tot}}} R2=1−SStotSSres | 衡量模型对数据变异的解释程度。越接近1,模型解释能力越强。 | [0, 1] (也可以为负,若模型拟合得非常差) | 直观地反映模型的拟合效果;可解释性强 | 对离群点敏感,不能单独衡量模型的误差大小 |
MSE | 均方误差 (Mean Squared Error) | MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 MSE=n1i=1∑n(yi−y^i)2 | 预测值与实际值之间误差的平方平均值。值越小,模型精度越高。 | [0, ∞) | 反映误差的平方,强调大误差 | 对离群点非常敏感;单位与原始数据不同 |
RMSE | 均方根误差 (Root Mean Squared Error) | RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} RMSE=n1i=1∑n(yi−y^i)2 | MSE的平方根,表示误差的平均大小,具有与数据相同的单位。 | [0, ∞) | 保留MSE的优点,且单位与原始数据一致 | 同样对离群点敏感 |
MAE | 平均绝对误差 (Mean Absolute Error) | MAE = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| MAE=n1i=1∑n∣yi−y^i∣ | 预测值与实际值之间误差的绝对值平均。值越小,模型精度越高。 | [0, ∞) | 不像MSE和RMSE那样对离群点过于敏感;容易解释 | 忽略了误差的方向性,不如MSE/ RMSE敏感 |