统计推断——假设检验——线性回归——R的平方可以为负数

在《统计推断——假设检验——简单线性回归分析》,我们学到了一个回归模型评价指标:决定系数R^{2}

回顾一下决定系数R^{2}的公式:R^{2}=\frac{SSR}{SST}=1-\frac{SSE}{SST},其中SST代表离差总平方和,SSE代表残差平方和,SSR代表回归平方和,各指标计算如下所示:

例如下图中,P表示某一个观察点。

则根据:SST=SSR+SSE,根据上图进行分解:\sum (Y-\overline{Y})^2=\sum (\widehat{Y}-\overline{Y})^2+\sum (Y-\widehat{Y})^2

我们以下面数据为例,以Y=X^{2}生成点:

 生成的数据点(X,Y)\left ( X,Y \right )\overline{Y}如下图所示.,在图中,蓝线上的数据是我们生成的数据,水平红线是该数据的平均值。这样根据公式我们就可以求出SST=\sum (Y-\overline{Y})^2=1092

此数据的线性回归方程为\widehat{Y}=6X+5,将X代入可以求出相应的\widehat{Y},然后根据公式SSE=\sum (Y-\widehat{Y})^2,我们可以求得残差平方和SSE=84

最后根据公式:R^{2}=\frac{SSR}{SST}=1-\frac{SSE}{SST}=1-\frac{84}{1092}=0.9231

算出来决定系数R^{2},那么如何定义它的效益呢?

  • R^{2}为1.0最佳。这意味着你的回归模型没有错误。
  • R^{2}为0表示你的回归并不比取平均值更好,即你没有使用其他变量中的任何信息。
  • R^{2}为负表示你的回归模型的表现比平均值还差。

下面我们来考虑一个问题,R^{2}可以为负吗?什么时候为负?

通过上面我们知道:任何大于零的R^{2}都意味着回归分析比仅使用一条穿过平均值的水平线要好。在极少数情况下,你会得到负R^{2}值,你可能应该重新考虑回归分析,尤其是在强制进行截距的情况下。

我们还是继续上面的数据进行讨论,我们随便找个线性回归方程为\widehat{Y}=-2X+20,如下图黑线代表\widehat{Y}=-2X+20,将X代入可以求出相应的\widehat{Y},然后根据公式SSE=\sum (Y-\widehat{Y})^2,我们可以求得残差平方和SSE=1883

最后根据公式:R^{2}=\frac{SSR}{SST}=1-\frac{SSE}{SST}=1-\frac{1883}{1092}=-0.7244

这个时候我们计算出来的R^{2}就变成了负数,他代表的意义在于:该线性回归模型(黑线)对数据的拟合效果,还不如均值模型(红线)。在现实应用中,很少会出现这么离谱的情况,所以一般认为有用的模型的R^{2}的取值范围在0-1之间。

 

  • 11
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xia ge tou lia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值