数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。
首先先回顾复习三个概念:
1. 方差
方差是在概率论和统计方差衡量随机变量或一组数据的离散程度的度量方式,方差越大,离散度越大。求解方式为,各随机变量与平均值差值的平方和的平均数(先求差,再平方,再平均)
平均数:
方差公式:
也可以通过以下的方式进行求解方差:
2. 标准差
标准差就是方差的算术平方根,它反映组内个体间的离散程度。因此它的过程是与平均值之间进行差值计算。
2.1.SSE(和方差)
在统计学里,该参数计算的是拟合数据很原始数据对应点的误差的平方和,计算公式为:
其中是真实数据,
是拟合的数据,
从这里可以看出SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样。
2.2 MSE(均方方差)
该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是,和SSE没有太大的区别,计算公式为:
其中n为样本的个数。
2.3 RMSE(均方根)
该统计参数,也叫回归系统的拟合标准差,是MSE的平方根,计算公式为:
以上三个统计参数,虽然略有细微的差别,但是代表的都是数据拟合的好坏,只是标准不一样。
2.4 MAE(Mean Absolute Error)平方绝对误差
是绝对误差的平均值 ,可以更好地反映预测值误差的实际情况。