协方差与相关系数
- 背景:对于多维随机变量,反映分量之间关系的数字特征中,最重要的是协方差和相关系数
1.协方差
-
定义:任意两个随机变量X和Y的协方差,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)定义为
C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[X−E(X)][Y−E(Y)]} -
性质:
- C o v ( X , Y ) = C o v ( Y , X ) Cov(X,Y)=Cov(Y,X) Cov(X,Y)=Cov(Y,X)
- C o v ( a X , b Y ) = a b C o v ( X , Y ) a , b 是 常 数 Cov(aX,bY)=abCov(X,Y) \quad a,b 是常数 Cov(aX,bY)=abCov(X,Y)a,b是常数
- C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
-
计算协方差公式:
由协方差的定义及期望的性质,可得
C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\} \\ =E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) \\ =E(XY) - E(X)E(Y) Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)=E(XY)−E(X)E(Y)
可见,若X与Y独立,则 C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0 -
随机变量和的方差与协方差的关系
D ( X + Y ) = D ( X ) + D ( Y ) + 2 C o v ( X , Y ) D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) + 2 ∑ ∑ i < j C o v ( X i , X j ) D(X+Y)=D(X)+D(Y)+2Cov(X,Y) \\ D(\sum_{i=1}^nX_i)=\sum_{i=1}^nD(X_i)+2\sum\sum_{i<j}Cov(X_i,X_j) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(i=1∑nXi)=i=1∑nD(Xi)+2∑i<j∑Cov(Xi,Xj)
若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn两两独立,则上式化为
D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) D(\sum_{i=1}^nX_i)=\sum_{i=1}^nD(X_i) D(i=1∑nXi)=i=1∑nD(Xi)
2. 相关系数
-
背景:协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响。例如:
C o v ( k X , k Y ) = k 2 C o v ( X , Y ) Cov(kX,kY)=k^2Cov(X,Y) Cov(kX,kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化,引入了相关系数 -
定义:设 D ( X ) > 0 , D ( Y ) > 0 D(X)>0,D(Y)>0 D(X)>0,D(Y)>0,称
ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) \rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} ρXY=D(X)D(Y)Cov(X,Y)
为随机变量X和Y的相关系数,记 ρ X Y \rho_{XY} ρXY为 ρ \rho ρ -
相关系数的性质:
- ∣ ρ ∣ ≤ 1 |\rho|\leq 1 ∣ρ∣≤1
- X和Y独立时, ρ = 0 \rho=0 ρ=0,但其逆命题不一定成立
- | ρ \rho ρ|=1,即存在常数 a , b ( b ≠ 0 ) a,b(b\neq 0) a,b(b=0),使 P Y = a + b X = 1 P{Y=a+bX}=1 PY=a+bX=1,即X和Y以概率1线性相关
-
独立与相关的关系:
-
若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立
但若 ( X , Y ) (X,Y) (X,Y)服从二维正态分布,则独立与不相关等价
-
-
意义:相关系数刻画了X和Y间”线性相关“的程度
-
考虑以X的线性函数 a + b X a+bX a+bX来近似表示Y,以均方误差 e = E [ Y − ( a + b X ) ] 2 e=E{[Y-(a+bX)]^2} e=E[Y−(a+bX)]2来衡量以 a + b X a+bX a+bX近似表达Y的好坏程度。
e值越小表示 a + b X a+bX a+bX与Y的近似程度越好。通常用微积分中求极值的方法,求出使e达到最小时的a,b。
证明:
e = E [ Y − ( a + b X ) ] 2 = E ( Y 2 ) + b 2 E ( X 2 ) + a 2 − 2 b E ( X Y ) + 2 a b E ( X ) − 2 a E ( Y ) e=E{[Y-(a+bX)]^2}=E(Y^2)+b^2E(X^2)+a^2-2bE(XY)+2abE(X)-2aE(Y) e=E[Y−(a+bX)]2=E(Y2)+b2E(X2)+a2−2bE(XY)+2abE(X)−2aE(Y){ ∂ e ∂ a = 2 a + 2 b E ( X ) − 2 E ( Y ) = 0 ∂ e ∂ b = 2 b E ( X 2 ) − 2 E ( X Y ) + 2 a E ( X ) = 0 \begin{cases} \frac{\partial e}{\partial a}=2a+2bE(X)-2E(Y)=0 \\ \frac{\partial e}{\partial b}=2bE(X^2)-2E(XY)+2aE(X)=0 \end{cases} {∂a∂e=2a+2bE(X)−2E(Y)=0∂b∂e=2bE(X2)−2E(XY)+2aE(X)=0
解得
{ b 0 = C o v ( X , Y ) D ( X ) a 0 = E ( Y ) − b 0 E ( X ) \begin{cases} b_0=\frac{Cov(X,Y)}{D(X)} \\ a_0=E(Y)-b_0E(X) \end{cases} {b0=D(X)Cov(X,Y)a0=E(Y)−b0E(X)
这样求出的最佳逼近为
L ( X ) = a 0 + b 0 X L(X)=a_0+b_0X L(X)=a0+b0X