python统计分析——协方差和pearson相关系数

参考资料:用python动手学统计学

使用数据见代码:

dic={
    "x":[18.5,18.7,19.1,19.7,21.5,21.7,21.8,22.0,23.4,23.8],
    "y":[34,39,41,38,45,41,52,44,44,49]
}
cov_data=pd.DataFrame(dic)

变量x、y的协方差Cov(x,y)的计算公式如下:

\mathrm{Cov}(x,y)=\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu_x)(y_{i}-\mu_{y})=\frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\bar{x})(y_{i}-\bar{y})

协方差的含义:

协方差大于0:一个变量取值越大,另一个变量的取值也越大;

协方差小于0:一个变量取值越大,另一个变量的取值越小;

协方差等于0:两个变量不相关。

numpy.cov()函数可计算出x和y的协方差矩阵。

当指定ddof=0时,计算总体的协方差

当指定ddof=1时,计算样本协方差

       在协方差矩阵中,左上到右下的对角线上分别是x和y的标准差,左下到右上的对角线上分别是x和y的标准差。

 pearson相关系数

\rho _(x,y)=\frac{\mathrm{Cov}(x,y)}{\sigma_{x}\sigma_{y}}

python实现方法:

方法1:dataframe.corr()

方法2:series.corr()

方法3:numpy.corrcoef()

  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值