[转载]超全面的协方差矩阵介绍

 

[转载]超全面的协方差矩阵介绍

转载地址:https://blog.csdn.net/hustqb/article/details/90264432

阅读本文需要具备一定的线性代数基础,通过本文,你将对协方差矩阵有全面的理解。

定义

一组随机变量,共n个:
X = ( X 1 , X 2 , . . . , X n ) T \mathbf{X}=(X_1,X_2,...,X_n)^TX=(X1​,X2​,...,Xn​)T

两个随机变量的协方差:
c o v [ X i , X j ] = E [ ( X i − E [ X i ] ) ( X j − E [ X j ] ) ] cov[X_i,X_j]=E[(X_i-E[X_i])(X_j-E[X_j])]cov[Xi​,Xj​]=E[(Xi​−E[Xi​])(Xj​−E[Xj​])]

由n*n个协方差组成的协方差矩阵
c o v [ X , X ] = [ c o v [ X 1 , X 1 ] c o v [ X 1 , X 2 ] ⋯ c o v [ X 1 , X n ] c o v [ X 2 , X 1 ] c o v [ X 2 , X 2 ] ⋯ c o v [ X 2 , X n ] ⋮ ⋮ ⋱ ⋮ c o v [ X n , X 1 ] c o v [ X n , X 2 ] ⋯ c o v [ X n , X n ] ] cov[\mathbf{X,X}]={

⎡⎣⎢⎢⎢⎢⎢cov[X1,X1]cov[X2,X1]⋮cov[Xn,X1]cov[X1,X2]cov[X2,X2]⋮cov[Xn,X2]⋯⋯⋱⋯cov[X1,Xn]cov[X2,Xn]⋮cov[Xn,Xn]⎤⎦⎥⎥⎥⎥⎥[cov[X1,X1]cov[X1,X2]⋯cov[X1,Xn]cov[X2,X1]cov[X2,X2]⋯cov[X2,Xn]⋮⋮⋱⋮cov[Xn,X1]cov[Xn,X2]⋯cov[Xn,Xn]]

}cov[X,X]=⎣⎢⎢⎢⎡​cov[X1​,X1​]cov[X2​,X1​]⋮cov[Xn​,X1​]​cov[X1​,X2​]cov[X2​,X2​]⋮cov[Xn​,X2​]​⋯⋯⋱⋯​cov[X1​,Xn​]cov[X2​,Xn​]⋮cov[Xn​,Xn​]​⎦⎥⎥⎥⎤​

直观理解

  1. 协方差表示两个随机变量之间的线性相关性
  2. 协方差矩阵中的每个元素代表了两个随机变量之间的协方差
  3. 协方差矩阵表示一组随机变量之间的两两线性相关性

例子

图片和示例来源(点击进入图片来源

有二维随机变量x和y,简便期间,我们对x和y做了去均值处理(x ˉ = y ˉ = 0 \bar x=\bar y = 0xˉ=yˉ​=0),所以x和y之间的协方差:c o v [ x , y ] = E [ ( x − x ˉ ) ( y − y ˉ ) ] = E [ x ⋅ y ] cov[x,y] = E[(x-\bar x)(y-\bar y)]=E[x\cdot y]cov[x,y]=E[(x−xˉ)(y−yˉ​)]=E[x⋅y]

如果x和y的联合分布多分布在一三象限,x ⋅ y x\cdot yx⋅y多为正数,则协方差为正,x和y正相关。

如果x和y的联合分布多分布在二四象限,x ⋅ y x\cdot yx⋅y多为负数,则协方差为负,x和y负相关。

如果x和y的几乎均匀地分散在所有象限中,则x ⋅ y x\cdot yx⋅y有正有负,均值接近于0,说明x和y之间没有相关性(只是说没有线性相关)。

线性相关与非线性相关

若两个向量的协方差为0,则两个向量不具备线性相关性,但它们仍然可能不独立,因为可能存在非线性的相关性。

具体的,协方差为0但不独立的原因在于:随机向量x和随机向量y之间的关系没有一阶分量,只有二阶或高阶分量(关于一阶分量、二级分量等详见泰勒公式)。

举个例子(来自知乎匿名用户):对于随机变量x和随机变量y,有x 2 + y 2 = 1 x^2+y^2=1x2+y2=1,其几何关系如下图:

性质

协方差矩阵是半正定矩阵

半正定矩阵的定义:
设A是实对称矩阵。如果对任意的实非零列向量x有x T A x ≥ 0 x^TAx≥0xTAx≥0,就称A为半正定矩阵。
半正定矩阵的性质:

  1. 半正定矩阵的行列式是非负的
  2. 半正定矩阵的特征值都是非负的

延伸:
实对称矩阵一定是半正定矩阵
证明:协方差矩阵是半正定的
对任意向量y:
y T Σ y = y T E [ ( X − μ ) ( X − μ ) T ] y             = E [ y T ( X − μ ) ( X − μ ) T y ]                    = E [ ( ( X − μ ) T y ) T ( ( x − μ ) T y ) ]       = E [ ∣ ∣ ( X − μ ) T y ∣ ∣ 2 ] ≥ 0 y^T\Sigma y = y^TE[(X-\mu)(X-\mu)^T]y \\ \ \ \ \ \ \ \ \ \ \ \ =E[y^T(X-\mu)(X-\mu)^Ty] \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =E[((X-\mu)^Ty)^T((x-\mu)^Ty)] \\ \ \ \ \ \ =E[||(X-\mu)^Ty||^2] \geq 0yTΣy=yTE[(X−μ)(X−μ)T]y           =E[yT(X−μ)(X−μ)Ty]                  =E[((X−μ)Ty)T((x−μ)Ty)]     =E[∣∣(X−μ)Ty∣∣2]≥0

正定矩阵的定义:
A是n阶方阵,如果对任何非零向量x,都有x T A x > 0 x^TAx>0xTAx>0,其中x T x^TxT 表示x的转置,就称A正定矩阵
正定矩阵的性质:

  1. 正定矩阵的行列式恒为正
  2. 正定矩阵的特征值均为正

协方差矩阵是实对称矩阵

实对称矩阵的性质:

  1. 实对称矩阵的不同特征值对应的特征向量时正交的
  2. 实对称矩阵的特征值是实数,特征向量是实向量
  3. 实对称矩阵必可对角化,且其相似对角矩阵的对角线元素为n个特征值

实对称矩阵的对角化:
P − 1 A P = P − 1 P ∧ = ∧ P^{-1}AP = P^{-1}P \wedge=\wedgeP−1AP=P−1P∧=∧

其中对角矩阵∧ \wedge∧的对角元素为矩阵A的n个特征值(n个特征值中可能重复的),P由矩阵A的特征向量组成。

与其他统计量的关系

与协方差的关系:

  • 协方差矩阵的第i行第j列的元素是第i个随机向量和第j个随机向量之间的协方差
  • 从协方差到协方差矩阵是从标量随机变量到高维随机向量的推广

与相关系数矩阵的关系:
相关系数矩阵为c o r r ( X ) corr(\mathbf{X})corr(X)
corr ⁡ ( X ) = ( diag ⁡ ( c o v ( X X ) ) ) − 1 2   c o v ( X X )   ( diag ⁡ ( c o v ( X X ) ) ) − 1 2 {\displaystyle \operatorname {corr} (\mathbf {X} )={\big (}\operatorname {diag} (cov({\mathbf {X} \mathbf {X} })){\big )}^{-{\frac {1}{2}}}\,cov({\mathbf {X} \mathbf {X}) }\,{\big (}\operatorname {diag} (cov({\mathbf {X} \mathbf {X}) }){\big )}^{-{\frac {1}{2}}}}corr(X)=(diag(cov(XX)))−21​cov(XX)(diag(cov(XX)))−21​

延伸:PCA中对协方差矩阵的应用

详见《图文并茂的PCA教程》

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值