皮尔逊相关系数分析

基本含义:

皮尔逊相关系数分析(Pearson Correlation Coefficient Analysis)是一种统计方法,用于衡量两个变量之间的线性相关性。它是最常见的相关性分析方法之一,用于判断两个变量是否呈现线性关系,并通过相关系数的数值大小和符号表示相关性强度和方向。

计算公式:

参数评估:

皮尔逊相关系数 rrr 的取值范围在 -1 到 1 之间:

  • r=1:表示两个变量之间存在完全正线性相关,即一个变量增加时,另一个变量也总是按比例增加。
  • r=−1:表示两个变量之间存在完全负线性相关,即一个变量增加时,另一个变量总是按比例减少。
  • r=0:表示两个变量之间没有线性关系

python代码实现:

(1)问题示例

现在有一个成绩表,内含“语文”“数学”“英语”学科以及“总成绩”,研究:“语文”成绩和“总成绩”之间的皮尔逊相关性。(注意运行的时候要将xlsx文件放在python运行文件内,第一层文件路径下)

(2)代码实现

在python中,当我们安装好pandas库之后,我们可以直接调用库中的相关系数函数corr()来实现:

完整python代码如下:

import pandas as pd

# 读取 Excel 文件
file_path = '学生成绩表.xlsx'

# 加载 Excel 文件的第一个工作表
df = pd.read_excel(file_path, sheet_name='Sheet1')

# 计算“语文成绩”和“总成绩”之间的皮尔逊相关系数
pearson_corr = df['语文'].corr(df['总成绩'])

# 输出皮尔逊相关系数
print(f"语文成绩和总成绩之间的皮尔逊相关系数为: {pearson_corr}")

(3)效果

资源获取:

表格的获取方式如下:

通过网盘分享的文件:学生成绩表.zip
链接: https://pan.baidu.com/s/1k-Km-Alo3x73QQfSLYQBYw?pwd=rsx7 提取码: rsx7
--来自百度网盘超级会员v5的分享

好啦,希望能够帮助到大家!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

还不秃顶的计科生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值