下面介绍这些统计参数
基于预测值(y)和原始值(y)之间的误差参数:SSE,MSE,RMSE
(1)SSE(和方差):The sum of squares due to error
描述拟合数据和原始数据对应点的误差的平方和
SSE越接近于0,说明模型选择和原数据拟合更好,数据预测也越好。
(2)MSE(均方差,标准差):Root mean squared error
描述预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n。
(3)RMSE(均方根):Root mean squared error
描述回归系统的拟合标准差,是MSE的平方根
下面这些统计参数:误差参数都是相对原始数据平均值
(4) R-square(确定系数):Coefficient of determination
R-square=SSR/SST
(1)SSR:Sum of squares of the regression
即预测数据与原始数据均值之差的平方和。
(2)SST:Total sum of squares
即原始数据和均值之差的平方和。
我们可以发现SST=SSE+SSR
故可得
R-square的正常取值范围为[0 ,1],越接近1,表明方程的变量对y的解释能力越强,该模型对数据拟合的较好。