协方差与相关系数的区别和联系

协方差和相关系数是衡量变量间关系强度的统计指标。协方差描述了两个变量误差的关联程度,其正负表示变量变化趋势的一致性或相反性。相关系数是协方差标准化后的形式,取值范围在-1到1之间,更直观地表达了变量间的线性相关性程度。相关系数为1表示完全正相关,-1表示完全负相关,0表示不相关。
摘要由CSDN通过智能技术生成

协方差与相关系数的区别和联系。

协方差:
  • 公式: C o v ( X , Y ) = E [ ( X − μ x ) ( Y − μ y ) ] Cov(X,Y) = E[(X-\mu_x)(Y-\mu_y)] Cov(X,Y)=E[(Xμx)(Yμy)]
    协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
    注:协方差大小,会受X,Y数据大小的影响,所以只能通过协方差的正负,来判断是正相关还是负相关,不能反映相关性的程度,所以相关系数就此诞生
相关系数:
  • 公式: ρ = C o v ( X , Y ) ρ x ρ y \rho = \frac{Cov(X,Y)} {\rho_x \rho_y} ρ=ρxρyCov(X,Y)
    公式翻译一下,就是XY的协方差除X的标准差和Y的标准差
    所以,相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。是用来研究变量之间线性相关程度的量,取值范围是[-1,1]。
    可参考
    如何通俗易懂地解释「协方差」与「相关系数」的概念?
    (https://www.zhihu.com/question/20852004)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值