认识协方差矩阵

协方差矩阵是衡量多个随机变量之间线性相关性的工具,它包含每个变量的方差以及变量间的协方差。通过对数据进行标准化,协方差矩阵可以揭示不同特征之间的相关性。对角线元素表示各特征的方差,非对角线元素表示特征对之间的协方差,从而帮助我们了解数据集的结构和变量间的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

期望即均值,表示随机变量平均取值的大小。用E(x)E(x)E(x)表示。
在x离散情况下,设x=[x1,x2,⋯ ,xk]x=[x_1, x_2,\cdots, x_k]x=[x1,x2,,xk],x出现的概率为p(x)p(x)p(x),则
E(x)=∑i=1kxip(xi)E(x)=\sum_{i=1}^k x_i p(x_i) E(x)=i=1kxip(xi)
在x连续的情况下,设x对应的概率密度函数为f(x)f(x)f(x),则
E(x)=∫−∞+∞xf(x)dxE(x)=\int_{- \infty}^{+\infty}xf(x)dxE(x)=+xf(x)dx
方差是用来衡量一组数据的离散程度。用varvarvar表示,计算公式为:
var(x)=∑i=1k(xi−E(x))2k var(x) =\dfrac{\sum_{i=1}^k(x_i-E(x))^2}{k}var(x)=ki=1k(xiE(x))2
协方差是对两个随机变量联合分布线性相关程度的一种度量。当协方差的值大于0时,表示两个变量成正相关;当协方差的值小于0时,表示两个变量成负相关;当协方差的值为0时,两个变量线性无关。用公式表示为:
conv(X,Y)=E((X−E(X))(Y−E(Y)))conv(X,Y)=E((X-E(X))(Y-E(Y)))conv(X,Y)=E((XE(X))(YE(Y)))
由于随机变量取值范围不同,所以两个协方差之间没有可比性。假设X、Y和ZX、Y和ZXYZ分别为三个随机变量,我们无法直接通过conv(X,Y)和conv(X,Z)conv(X,Y)和conv(X,Z)conv(X,Y)conv(X,Z)来衡量变量X与谁相关性更强,因此定义了相关系数η\etaη,即对协方差除以标准差,进行标准化:
η=conv(X,Y)var(X)⋅var(Y)\eta=\dfrac{conv(X,Y)}{\sqrt{var(X)}\cdot\sqrt{var(Y)}}η=var(X) var(Y)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值