方差 残差 离差

1 总平方和(SST)、回归平方和(SSR)与残差平方和(SSE)     得到后,可以把Y分解为可以被解释变量解释的和不能被解释的两部分,

Y = X+=+                            (3.31)

定义总平方和(原始值-平均值
    SST = =- 2+T=Y 'Y - T   (3.32)

其中yt 的样本平均数,定义为=。定义回归平方和为(回归值-均值

SSR =  ='-T                                  (3.33)

其中的定义同上。残差平方和为(原始值-回归值

SSE = =='                              (3.34)

则有如下关系存在,

        SST = SSR + SSE                                                   (3.35)

    证明

        Y ' Y = (X+)' (X+) =' X 'X+'+ 2'X '.

由 (3.6) 式,有X '=0。代入上式得

Y ' Y =' X 'X+'='+'                                   (3.36)

从上式两侧同减T,得 (3.35) 式。                                        证毕




SSE(和方差、误差平方和):The sum of squares due to error

MSE(均方差、方差):Mean squared error
RMSE(均方根、标准差):Root mean squared error
R-square(确定系数):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient ofdetermination

下面我对以上几个名词进行详细的解释下,相信能给大家带来一定的帮助!!

一、SSE(和方差)(残差)
该统计 参数计算的是 拟合数据和原始数据对应点的误差的平方和,计算公式如下


SSE越接近于0,说明 模型选择和拟合更好,数据 预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样

二、MSE(均方差)
该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别,计算公式如下


三、RMSE(均方根)
该统计参数,也叫回归 系统的拟合标准差,是MSE的平方根,就算公式如下
rmse.gif

在这之前,我们所有的误差参数都是基于预测值(y_hat)和原始值(y)之间的误差(即点对点)。从下面开始是所有的误差都是相对原始数据平均值(y_ba)而展开的(即点对全)!!!

四、R-square(确定系数)
在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sum of squares of theregression,即 预测数据与原始数据均值之差的平方和,公式如下

(2)SST:Total sum of squares,即 原始数据和均值之差的平方和,公式如下

细心的网友会发现,SST=SSE+SSR,呵呵只是一个有趣的 问题。而我们的“确定系数”是 定义为SSR和SST的比值,故


其实“确定系数”是通过数据的变化来表征一个拟合的好坏。由上面的表达式可以知道“确定系数”的正常取值范围为[01],越接近1,表明 方程的 变量对y的解释能力越强,这个模型对数据拟合的也较好
  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值