python 相关分析

目录

1、背景

2、连续变量的相关分析

2.1 使用条件

2.2 使用系数 pearson

2.2.1 系数计算逻辑

2.2.2 系数公式

2.2.3 结果解释

2.3 应用案例

2.4 相关系数的显著性检验

2.4.1 显著性检验案例

3、等级变量的相关分析

3.1 适用条件

3.2 使用系数 spearmanr

3.2.1 系数使用公式

4、连续变量&分类变量 相关分析

4.1 二列相关适用条件

4.2 二列相关公式

4.3 点二列相关适用条件

4.4 点二列相关公式

4.5 代码实现

5、类别变量相关分析

5.1 适用条件

5.2 使用卡方进行相关分析


1、背景

用于考察变量间数量关联密切程度的统计分析方法,比如身高越高,体重一般会越大。

几乎所有涉及到多个变量的假设检验方法,都可以被看做是这些变量间的关联性分析。

1、t检验:分组变量与连续因变量间的关联性分析

2、卡方检验:行、列分类变量间的关联性分析

3、聚类分析:案例间的关联性分析

4、多变量回归:因变量和一组自变量间的关联性分析

以下是常见的相关分析以及代码实现:

2、连续变量的相关分析

2.1 使用条件

两个变量都是连续正态连续变量,且两者之间呈线性关系。备注:在进行相关分析之前进行图表展示以查看数据是否为线性分布

# 图表展示的代码

import matplotlib.pyplot as plt
plt.scatter(x,y) #使用散点图
plt.show()

2.2 使用系数 pearson

2.2.1 系数计算逻辑

计算两个变量的协方差,协方差可以放映两个随机变量的相关程度,但是可能存在二维空间中分布的一些数据,变量之间相关程度较小,但是数据分布的比较离散,这样会导致求出的协方差值较大,只用协方差就不合理,所以pearson相关系数是在协方差的基础上除以两个随机变量的标准差。

2.2.2 系数公式

\rho_{X,Y }=\frac{cov(X,Y))}{\sigma _{X}\sigma _{Y}} = \frac{E[(X-\mu_{X })(Y-\mu_{Y })]}{\sigma _{X}\sigma _{Y}}

2.2.3 结果解释

该系数结果是一个-1到1之间的值,绝对值越大表明相关性越强,正数为正相关,负数为相关,相关系数为0,表明它们之间不存在线性相关关系。

2.3 应用案例

#调用代码
np.corrcoef(a)#可计算行与行之间的相关系数,
np.corrcoef(a,rowvar=0)#用于计算各列之间的相关系数


#应用案例
import numpy as np 
data = np.array([[10, 10, 8, 9, 7],  
       [4, 5, 4, 3, 3],  
       [3, 3, 1, 1, 1]])

np.corrcoef(data) 
#输出结果,可见第一组数据和第三组数据相关性挺高
'''
array([[ 1.        ,  0.64168895,  0.84016805],
       [ 0.64168895,  1.        ,  0.76376262],
       [ 0.84016805,  0.76376262,  1.        ]])
'''
np.corrcoef(data,rowvar=0) #用于计算列之间的相关系数
  • 3
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Python中的相关分析可以通过散点图和相关系数来实现。 散点图是一种可视化工具,可以直观地展示两个变量之间的相关关系。可以使用seaborn或matplotlib库来绘制散点图。例如,可以使用sns.pairplot函数绘制一个包含多个变量的散点图矩阵。 相关系数是用来衡量两个变量之间线性相关程度的统计指标。在Python中,可以使用numpy、pandas、scipy和scikit-learn等库来计算相关系数。例如,可以使用numpy的corrcoef函数、pandas的DataFrame的corr方法、scipy的pearsonr函数或scikit-learn的f_regression函数来计算简单相关系数。 如果想计算偏相关系数,Python中没有现成的模块可以直接使用,但可以自定义函数来计算偏相关系数。可以使用stats库中的pearsonr函数来计算相关系数,并根据公式计算偏相关系数。 综上所述,Python中的相关分析可以通过散点图和相关系数来实现,同时也可以通过自定义函数来计算偏相关系数。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [基于Python相关分析(correlation)](https://blog.csdn.net/Arvin_Austin/article/details/92706624)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是鱼儿啊~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值