协方差

什么是协方差?

首先,这几个数理统计中的概念因该很熟悉了:

  • 均值: X ˉ = ∑ i = 1 n X i n \bar{X} = \frac{\sum_{i=1}^{n}X_{i}}{n} Xˉ=ni=1nXi
  • 标准差: s = ∑ i = 1 n ( X i − X ˉ ) 2 n s = \sqrt{\frac{\sum_{i=1}^{n}(X_{i}-\bar{X})^2} {n}} s=ni=1n(XiXˉ)2
  • 方差: s 2 = ∑ i = 1 n ( X i − X ˉ ) 2 n s^2 = \frac{\sum_{i=1}^{n}(X_{i}-\bar{X})^2} {n} s2=ni=1n(XiXˉ)2

那为什么 还要用协方差呢?那是因为标准差和方差一般是用来描述一维数据的,但是有时候我们遇到的是多维数据,当然,多维数据可以拆开成一维数据那样去统计,但是有时候我需要看不同维度之间数据之间的关系,那么这个时候就要用协方差,即协方差就是一种用来度量两个随机变量关系的统计量。

c o v ( X , Y ) = ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) n − 1 cov(X,Y)=\frac{\sum_{i=1}^{n}(X_{i}-\bar{X})(Y_{i}-\bar{Y})}{n-1} cov(X,Y)=n1i=1n(XiXˉ)(YiYˉ)

那么:

c o v ( X , X ) = v a r ( X ) cov(X,X)=var(X) cov(X,X)=var(X)( X X X的方差)
c o v ( X , Y ) = c o v ( Y , X ) cov(X,Y)=cov(Y,X) cov(X,Y)=cov(Y,X)

那么多维数据之间的关系呢?
用协方差矩阵

C n × n = ( c i , j , c i , j = c o v ( D i m i , D i m j ) ) C_{n \times n} = (c_{i,j},c_{i,j}=cov(Dim_{i},Dim_{j})) Cn×n=(ci,j,ci,j=cov(Dimi,Dimj))

例如三维矩阵

C = ( c o v ( x , x ) c o v ( x , y ) c o v ( x , z ) c o v ( y , x ) c o v ( y , y ) c o v ( y , z ) c o v ( z , x ) c o v ( z , y ) c o v ( z , z ) ) C=\begin{pmatrix} cov(x,x)&cov(x,y) &cov(x,z) \\ cov(y,x)&cov(y,y) &cov(y,z) \\ cov(z,x)&cov(z,y) &cov(z,z) \end{pmatrix} C=cov(x,x)cov(y,x)cov(z,x)cov(x,y)cov(y,y)cov(z,y)cov(x,z)cov(y,z)cov(z,z)

对角线是各个维度上的方差。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值