概率论第8记:随机变量的数字特征之协方差

前面讲了方差,是基于单个随机变量的。现在学习二维随机变量的方差,称为协方差。
比较一下方差和协方差的定义表达式:
为了清晰显示,不妨设cx=X-E(X),cy=Y-E(Y)
方差:D(X)=E(cx2)
协方差:COV(X,Y)=E(cx*cy)
上面公式继续推导,con(X,Y)=E(XY)-E(X)E(Y)
同时定义一个系数 ρ x y = c o v ( X , Y ) D ( X ) D ( Y ) \rho_{xy}=\frac{cov\left(X,Y\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(Y\right)}} ρxy=D(X) D(Y) cov(X,Y),称为X和Y的相关系数。
怎么理解这个系数呢?
1我们先假设X=Y,那么他们绝对相关,而且是百分之一百的相关。此时,cov(X,Y)= E ( X 2 ) − E 2 ( X ) E ( X 2 ) − E 2 ( X ) E ( X 2 ) − E 2 ( X ) = E ( X 2 ) − E 2 ( X ) E ( X 2 ) − E 2 ( X ) = 1 \frac{E(X^2)-E^2(X)}{\sqrt{E(X^2)-E^2(X)}\sqrt{E(X^2)-E^2(X)}}=\frac{E(X^2)-E^2(X)}{E(X^2)-E^2(X)}=1 E(X2)E2(X) E(X2)E2(X) E(X2)E2(X)=E(X2)E2(X)E(X2)E2(X)=1
2.假设X,Y互不影响,相互独立,那么con(X,Y)=E(XY)-E(Y)E(Y)=E(X)E(Y)-E(X)E(Y)=0。也验证了他们相互独立,互不影响
3.我们假设X,Y存在简单的线性相关:Y=aX+b,推算可得 ρ x y \rho_{xy} ρxy=1
证明过程 如下:
ρ x y = c o v ( X , Y ) D ( X ) D ( Y ) \rho_{xy}=\frac{cov\left(X,Y\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(Y\right)}} ρxy=D(X) D(Y) cov(X,Y)= c o v ( X , a X + B ) D ( X ) D ( a X + B ) \frac{cov\left(X,aX+B\right)} {\sqrt{D\left(X\right)}\sqrt{D\left(aX+B\right)}} D(X) D(aX+B) cov(X,aX+B)
= E ( X ∗ a X + b ) − E ( X ) ∗ E ( a X + B ) D ( X ) D ( a X + b ) = a E ( X 2 ) + b E ( X ) − a E 2 ( X ) − b E ( X ) D ( X ) a D ( X ) = a D ( X ) a D ( X ) = 1 \frac{E(X\ast aX+b)-E(X)\ast E(aX+B)}{\sqrt{D\left(X\right)}\sqrt{D\left(aX+b\right)}}=\frac{aE(X^2)+bE(X)-aE^2(X)-bE(X)}{\sqrt{D\left(X\right)}a\sqrt{D\left(X\right)}}=\frac{aD(X)}{aD(X)}=1 D(X) D(aX+b) E(XaX+b)E(X)E(aX+B)=D(X) aD(X) aE(X2)+bE(X)aE2(X)bE(X)=aD(X)aD(X)=1
反过来也说明,如果X和Y线性相关,那么相关系数一定为1
当系数=0时候,X,Y可能相关也可能不相关,但是至少不存在线性关系。.
以下内容来自于网友三山音的博文,原文地址:点击
4当协方差Cov(X,Y)>0时,称X与Y正相关
当协方差Cov(X,Y)<0时,称X与Y负相关
当协方差Cov(X,Y)=0时,称X与Y不相关
详细内容请点击上面的连接
从2可以推导出:D(X+Y)=D(X)+D(Y)+2cov(X,Y)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
概率论中的二维随机变量是指由两个随机变量组成的一种数学模型。它可以用来描述两个不同事件之间的关系和相互影响。 以下是一些与二维随机变量相关的重要知识点: 1. 概率密度函数(PDF):对于连续型二维随机变量,概率密度函数描述了其取值的概率分布情况。它可以通过对二维随机变量进行积分来计算概率。 2. 边缘分布:边缘分布指的是二维随机变量中每个单独变量的概率分布。通过边缘分布,可以计算某一个变量的概率,而忽略其他变量的取值情况。 3. 条件分布:条件分布指的是在给定另一个变量取值的条件下,某一个变量的概率分布。条件分布可以用来描述两个变量之间的依赖关系和相互影响。 4. 相关性和独立性:二维随机变量的相关性描述了两个变量之间的线性关系程度,可以通过协方差或相关系数来衡量。如果两个变量相互独立,则它们之间没有任何线性关系。 5. 边缘期望和协方差:边缘期望是指每个变量的期望值,可以用来描述随机变量的平均取值情况。协方差衡量了两个变量之间的总体线性关系,可以通过协方差矩阵来表示。 6. 线性变换和线性组合:对二维随机变量进行线性变换或线性组合可以得到新的随机变量。这些新的变量可能具有特定的概率分布和相关性。 这些是概率论中关于二维随机变量的一些重要知识点,希望能对你有所帮助。如果你还有其他问题,请继续提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值