线性回归模型验证参数:
- SSE(和方差,误差平方和)
该统计参数计算的是拟合数据和原始数据对应点的误差的平方和,计算公式如下:
其中,SSE越接近于0,说明模型拟合和选择更好,数据预测也越成功。 - MSE (均方差)
该统计参数是预测数据和原始数据对应点误差的平方和的均值。也就是SSE/n。
- RMSE (均方根)
该统计参数也称为回归系数的拟合标准差,是MSE的平方根,即(SSE/n)的1/2次方跟。
- R-square (确定系数)越接近于1越好,大于0.8就表示还不错。
在介绍该指标之前,先介绍另外两个参数SSR和SST。
SSR指的是预测数据和原始数据均值之差的平方和,SST指的是原始数据和均值之差的平方和。
有SST= SSE+SSR,而确定系数R-square定义为SSR和SST的比值: