日常学习之:如何理解协方差以及相关系数

本文介绍了如何利用Python计算两个随机事件(每天吃饭量与体重变化)之间的协方差和相关系数,以此来分析它们之间的相关性。通过NumPy和Pandas库,我们得到了0.9568的相关系数,表明这两个事件有很强的正相关性。协方差为0.19,标准差乘积相关系数也验证了这一结论。
摘要由CSDN通过智能技术生成

协方差和相关系数的应用场景

  • 现在有一个随机事件 X:我每天吃饭;这个随机事件每天都是在发生比如说 X 1... n X_{1...n} X1...n 代表了在 n 天的过程中,我每天吃饭的事件 X 1 = 0.5 k g , X 2 = 0.6 k g , X 3 = 0.7 k g X_1=0.5kg,X_2=0.6kg,X_3=0.7kg X1=0.5kg,X2=0.6kg,X3=0.7kg 所以我用 X = [0.5,0.6,0.7] 来表示上面这段描述

  • 还有另外一个随机事件 Y:我的体重;对应的用 Y 1... n Y_{1...n} Y1...n 来表示 n 天过程中我的体重这个事件,因此 Y = [ 65.3 , 68.2 , 69.1 ] Y=[65.3,68.2,69.1] Y=[65.3,68.2,69.1]

  • 然后我想知道这两个事件:我每天吃饭 和 我的体重 之间的相关性;我们就要用协方差和相关性系数来表示

import numpy as np
import pandas as pd
# 我们用 python 来计算一下两个事件的相关性系数
X = np.array([0.5,0.6,0.7] )
Y = np.array([65.3,68.2,69.1])
X = pd.Series(X)
Y = pd.Series(Y)
X.corr(Y)
0.9568015187270429
# 计算两个事件的协方差
X.cov(Y)
0.1899999999999998
# 通过协方差除以各自标准差的乘积得到相关性系数
X.cov(Y) / (X.std() * Y.std())
0.9568015187270428

协方差和相关系数的定义

协方差

C o v ( X , Y ) = 1 n − 1 ∑ i = 1 n ( X − X ‾ ) ( Y − Y ‾ ) Cov(X,Y)=\frac{1}{n-1}\sum_{i=1}^{n}{(X-\overline{X})(Y-\overline{Y})} Cov(X,Y)=n11i=1n(XX)(YY)

相关系数

ρ X , Y = C o v ( X , Y ) D ( X ) D ( Y ) ρ_{X,Y}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} ρX,Y=D(X) D(Y) Cov(X,Y)

  • C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 是协方差矩阵
  • D ( X ) \sqrt{D(X)} D(X) 是 X 事件的标准差
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暖仔会飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值