前面讲了方差,是基于单个随机变量的。现在学习二维随机变量的方差,称为协方差。
比较一下方差和协方差的定义表达式:
为了清晰显示,不妨设cx=X-E(X),cy=Y-E(Y)
方差:D(X)=E(cx2)
协方差:COV(X,Y)=E(cx*cy)
上面公式继续推导,con(X,Y)=E(XY)-E(X)E(Y)
同时定义一个系数
ρ
x
y
=
c
o
v
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{xy}=\frac{cov\left(X,Y\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(Y\right)}}
ρxy=D(X)D(Y)cov(X,Y),称为X和Y的相关系数。
怎么理解这个系数呢?
1我们先假设X=Y,那么他们绝对相关,而且是百分之一百的相关。此时,cov(X,Y)=
E
(
X
2
)
−
E
2
(
X
)
E
(
X
2
)
−
E
2
(
X
)
E
(
X
2
)
−
E
2
(
X
)
=
E
(
X
2
)
−
E
2
(
X
)
E
(
X
2
)
−
E
2
(
X
)
=
1
\frac{E(X^2)-E^2(X)}{\sqrt{E(X^2)-E^2(X)}\sqrt{E(X^2)-E^2(X)}}=\frac{E(X^2)-E^2(X)}{E(X^2)-E^2(X)}=1
E(X2)−E2(X)E(X2)−E2(X)E(X2)−E2(X)=E(X2)−E2(X)E(X2)−E2(X)=1
2.假设X,Y互不影响,相互独立,那么con(X,Y)=E(XY)-E(Y)E(Y)=E(X)E(Y)-E(X)E(Y)=0。也验证了他们相互独立,互不影响
3.我们假设X,Y存在简单的线性相关:Y=aX+b,推算可得
ρ
x
y
\rho_{xy}
ρxy=1
证明过程 如下:
ρ
x
y
=
c
o
v
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{xy}=\frac{cov\left(X,Y\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(Y\right)}}
ρxy=D(X)D(Y)cov(X,Y)=
c
o
v
(
X
,
a
X
+
B
)
D
(
X
)
D
(
a
X
+
B
)
\frac{cov\left(X,aX+B\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(aX+B\right)}}
D(X)D(aX+B)cov(X,aX+B)
=
E
(
X
∗
a
X
+
b
)
−
E
(
X
)
∗
E
(
a
X
+
B
)
D
(
X
)
D
(
a
X
+
b
)
=
a
E
(
X
2
)
+
b
E
(
X
)
−
a
E
2
(
X
)
−
b
E
(
X
)
D
(
X
)
a
D
(
X
)
=
a
D
(
X
)
a
D
(
X
)
=
1
\frac{E(X\ast aX+b)-E(X)\ast E(aX+B)}{\sqrt{D\left(X\right)}\sqrt{D\left(aX+b\right)}}=\frac{aE(X^2)+bE(X)-aE^2(X)-bE(X)}{\sqrt{D\left(X\right)}a\sqrt{D\left(X\right)}}=\frac{aD(X)}{aD(X)}=1
D(X)D(aX+b)E(X∗aX+b)−E(X)∗E(aX+B)=D(X)aD(X)aE(X2)+bE(X)−aE2(X)−bE(X)=aD(X)aD(X)=1
反过来也说明,如果X和Y线性相关,那么相关系数一定为1
当系数=0时候,X,Y可能相关也可能不相关,但是至少不存在线性关系。.
以下内容来自于网友三山音的博文,原文地址:点击
4当协方差Cov(X,Y)>0时,称X与Y正相关
当协方差Cov(X,Y)<0时,称X与Y负相关
当协方差Cov(X,Y)=0时,称X与Y不相关
详细内容请点击上面的连接
从2可以推导出:D(X+Y)=D(X)+D(Y)+2cov(X,Y)
概率论第8记:随机变量的数字特征之协方差
最新推荐文章于 2022-12-06 18:47:40 发布