统计推断——假设检验——线性回归——R的平方可以为负数

最新推荐文章于 2025-02-21 19:54:54 发布

xia ge tou lia

最新推荐文章于 2025-02-21 19:54:54 发布

阅读量1.4w

点赞数 11

分类专栏：线性代数假设检验

本文链接：https://blog.csdn.net/huangguohui_123/article/details/111207460

版权

假设检验同时被 2 个专栏收录

18 篇文章

订阅专栏

线性代数

6 篇文章

订阅专栏

本文探讨了统计推断中的决定系数，解释了其计算原理，重点讲解了决定系数为负值的情况，以及它在评估模型有效性的上下限。通过实例说明，揭示了当回归模型不如简单平均线时的异常情况及其应对策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在《统计推断——假设检验——简单线性回归分析》，我们学到了一个回归模型评价指标：决定系数 $R^{2}$ 。

回顾一下决定系数 $R^{2}$ 的公式： $R^{2}=\frac{SSR}{SST}=1-\frac{SSE}{SST}$ ，其中 $SST$ 代表离差总平方和， $SSE$ 代表残差平方和， $SSR$ 代表回归平方和，各指标计算如下所示：

例如下图中，P表示某一个观察点。

则根据： $SST=SSR+SSE$ ，根据上图进行分解： $\sum (Y-\overline{Y})^2=\sum (\widehat{Y}-\overline{Y})^2+\sum (Y-\widehat{Y})^2$ 。

我们以下面数据为例，以 $Y=X^{2}$ 生成点：

生成的数据点 $（X,Y）$ $\left ( X,Y \right )$ 及 $\overline{Y}$ 如下图所示.，在图中，蓝线上的数据是我们生成的数据，水平红线是该数据的平均值。这样根据公式我们就可以求出 $SST=\sum (Y-\overline{Y})^2=1092$ 。

此数据的线性回归方程为 $\widehat{Y}=6X+5$ ，将 $X$ 代入可以求出相应的 $\widehat{Y}$ ，然后根据公式 $SSE=\sum (Y-\widehat{Y})^2$ ，我们可以求得残差平方和 $SSE=84$ 。

最后根据公式： $R^{2}=\frac{SSR}{SST}=1-\frac{SSE}{SST}=1-\frac{84}{1092}=0.9231$

算出来决定系数 $R^{2}$ ，那么如何定义它的效益呢？

$R^{2}$ 为1.0最佳。这意味着你的回归模型没有错误。
$R^{2}$ 为0表示你的回归并不比取平均值更好，即你没有使用其他变量中的任何信息。
$R^{2}$ 为负表示你的回归模型的表现比平均值还差。

下面我们来考虑一个问题， $R^{2}$ 可以为负吗？什么时候为负？

通过上面我们知道：任何大于零的 $R^{2}$ 都意味着回归分析比仅使用一条穿过平均值的水平线要好。在极少数情况下，你会得到负 $R^{2}$ 值，你可能应该重新考虑回归分析，尤其是在强制进行截距的情况下。

我们还是继续上面的数据进行讨论，我们随便找个线性回归方程为 $\widehat{Y}=-2X+20$ ，如下图黑线代表 $\widehat{Y}=-2X+20$ ，将 $X$ 代入可以求出相应的 $\widehat{Y}$ ，然后根据公式 $SSE=\sum (Y-\widehat{Y})^2$ ，我们可以求得残差平方和 $SSE=1883$ 。