在机器学习中,评估模型性能时常用的四个指标包括平均绝对误差(Mean Absolute Error, MAE)、均方误差(Mean Squared Error, MSE)、均方根误差(Root Mean Squared Error, RMSE)和决定系数(R-squared, R²)。
一、MBE(平均偏差误差)
平均偏差误差(MBE)是衡量模型预测值与实际值之间偏差的指标。然而,值得注意的是,在常见的机器学习评估指标中,MBE并不如MAE、RMSE和R2那样广泛被提及或使用。在某些特定场景下,MBE可能被用作评估模型预测偏差的一个补充指标,但其具体定义和计算方法可能因应用场景的不同而有所差异。因此,在讨论机器学习评估指标时,MBE通常不是核心指标之一。
二、MAE(平均绝对误差)
MAE 是预测值与实际值之差的绝对值的平均数。它给出了预测误差的平均大小,但不考虑误差的方向(正或负)。相比MSE和RMSE,MAE对异常值不敏感,不会因为少数大误差的平方而放大结果,适用于具有较多异常值的数据集。然而,MAE的缺点在于缺乏方向性,即它无法反映出误差是正偏还是负偏,可能不适用于需要区分偏差方向的应用场景。
三、RMSE(均方根误差)
均方根误差(RMSE)是均方误差(MSE)的平方根。MSE是衡量预测值与实际值之间平方差的平均值,而RMSE则将其量级与原始数据保持一致,便于解释。由于计算了平方差,RMSE对大误差的惩罚更大,适合对误差敏感的场景。RMSE的单位与原数据相同,因此容易理解。然而,RMSE的缺点在于对异常值敏感,可能会因为少数大误差的平方而放大结果。
四、R2(决定系数)
决定系数(R2)用于确定数据与拟合回归线的接近程度。它表示模型解释数据方差的比例,范围是0到1。R2的值越接近1,表示模型对数据的拟合程度越好;越接近0,表示模型对数据的拟合程度越差。R2的值被标准化在0到1之间,便于比较不同模型的性能。然而,R2的缺点在于:当数据的范围很大时,即使模型的预测值与实际值之间存在较大的偏差,R2的值也可能很高。R2无法直接反映模型是否过拟合,需要结合其他指标(如交叉验证)来评估模型的性能。
五、sklearns库里自带计算方法
1.方法一
# 导入
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from math import sqrt
#测试集四个指标
predictions = rf.predict(test_datas)# 预测结果
errors = (predictions-test_labels).astype(float) # 计算