Cook距离

最新推荐文章于 2020-12-30 17:12:15 发布

知道不_zkl

最新推荐文章于 2020-12-30 17:12:15 发布

阅读量1w

点赞数 2

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41500849/article/details/80321222

版权

机器学习专栏收录该内容

28 篇文章 2 订阅

订阅专栏

Cook距离

对于线性模型

Y = X β + ϵ . E (ϵ) = 0, C o v (ϵ) = σ 2 I n (1)

$Y = X\beta+\epsilon.E(\epsilon)=0,Cov(\epsilon)=\sigma^2I_n \tag1$

β β $\beta$ 的最小二乘估计为

β^=(XTX)−1XTY β ^ = ( X T X ) − 1 X T Y $\hat \beta = (X^TX)^{-1}X^TY$ ，用

Y(i) Y ( i ) $Y_{(i)}$ ,

X(i) X ( i ) $X_{(i)}$ 和

ϵ(i) ϵ ( i ) $\epsilon_{(i)}$ 分别表示

Y Y $Y$ ,

X

$X$ 和

ϵ ϵ $\epsilon$ 中提出第

i i $i$ 行得到向量或者矩阵，剩下的

n - 1

$n-1$ 组数据的线性模型为：

Y (i) = X (i) β + ϵ (i) . E (ϵ (i)) = 0, C o v (ϵ (i)) = σ 2 I n - 1 (2)

$Y_{(i)} = X_{(i)}\beta+\epsilon_{(i)}.E(\epsilon_{(i)})=0,Cov(\epsilon_{(i)})=\sigma^2I_{n-1} \tag2$
由此模型得到的

β β $\beta$ 的最小二乘估计为

β^(i)=(XT(i)X(i))−1XT(i)Y(i) β ^ ( i ) = ( X ( i ) T X ( i ) ) − 1 X ( i ) T Y ( i ) $\hat \beta_{(i)} = (X_{(i)}^TX_{(i)})^{-1}X_{(i)}^TY_{(i)}$ 。称

IF=β^−β^(i) I F = β ^ − β ^ ( i ) $IF=\hat \beta-\hat \beta _{(i)}$ 为第

i i $i$ 组数据对

β

$\beta$ 的印象函数，反映了第

i i $i$ 组数据对回归系数估计

β

$\beta$ 的影响大小，由于此函数为向量函数，不便于定量比较影响的大小，考虑引入某种数量化的函数，

Cook C o o k $Cook$ 统计量是使用最为广泛的一种。

D i, 1 (M, C) = (β^- β^(i)) T M (β^- β^(i)) / C . (3)

$D_{i,1} (M,C)=(\hat \beta - \hat \beta_{(i)})^TM(\hat \beta - \hat \beta_{(i)})/C. \tag 3$
式中，

M M $M$ 为正定矩阵，

C

$C$ 为给定的常数，

Di,1(M,C) D i , 1 ( M , C ) $D_{i,1} (M,C)$ 度量了回归系数估计

β β $\beta$ 的影响大小，取

M=XTX M = X T X $M=X^TX$ ,

C=pσ^2 C = p σ ^ 2 $C=p\hat \sigma^2$ （

p p $p$ 为必要观测数，

{\hat{σ}}^{2}

$\hat \sigma ^2$ 为利用完全数据计算得到的单位权方差），则成为

Cook C o o k $Cook$ 距离，则：

D i, 1 (X T X, C) = ( β ^ - β ^ ( i ) ) T X T X ( β ^ - β ^ ( i ) ) p σ ^ 2 (4)

$D_{i,1} (X^TX,C)= \frac {(\hat \beta - \hat \beta_{(i)})^TX^TX(\hat \beta - \hat \beta_{(i)})} {p\hat \sigma^2} \tag 4$

Cook C o o k $Cook$ 距离越大，表示提出第组数据后，参数的变化越大。计算得到的值较大的点实际上是偏离预先选定的经验协方差函数模型较大的点，将之剔除，以达到拟合点优选的目的，提高协方差函数的拟合精度。

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
Cook距离

Cook距离对于线性模型 Y=Xβ+ϵ.E(ϵ)=0,Cov(ϵ)=σ2In(1)(1)Y=Xβ+ϵ.E(ϵ)=0,Cov(ϵ)=σ2InY = X\beta+\epsilon.E(\epsilon)=0,Cov(\epsilon)=\sigma^2I_n \tag1 ββ\beta的最小二乘估计为β^=(XTX)−1XTYβ^=(XTX)−1XTY\hat \beta = (X^...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。