基本含义:
皮尔逊相关系数分析(Pearson Correlation Coefficient Analysis)是一种统计方法,用于衡量两个变量之间的线性相关性。它是最常见的相关性分析方法之一,用于判断两个变量是否呈现线性关系,并通过相关系数的数值大小和符号表示相关性强度和方向。
计算公式:
参数评估:
皮尔逊相关系数 rrr 的取值范围在 -1 到 1 之间:
- r=1:表示两个变量之间存在完全正线性相关,即一个变量增加时,另一个变量也总是按比例增加。
- r=−1:表示两个变量之间存在完全负线性相关,即一个变量增加时,另一个变量总是按比例减少。
- r=0:表示两个变量之间没有线性关系。
python代码实现:
(1)问题示例
现在有一个成绩表,内含“语文”“数学”“英语”学科以及“总成绩”,研究:“语文”成绩和“总成绩”之间的皮尔逊相关性。(注意运行的时候要将xlsx文件放在python运行文件内,第一层文件路径下)
(2)代码实现
在python中,当我们安装好pandas库之后,我们可以直接调用库中的相关系数函数corr()来实现:
完整python代码如下:
import pandas as pd
# 读取 Excel 文件
file_path = '学生成绩表.xlsx'
# 加载 Excel 文件的第一个工作表
df = pd.read_excel(file_path, sheet_name='Sheet1')
# 计算“语文成绩”和“总成绩”之间的皮尔逊相关系数
pearson_corr = df['语文'].corr(df['总成绩'])
# 输出皮尔逊相关系数
print(f"语文成绩和总成绩之间的皮尔逊相关系数为: {pearson_corr}")
(3)效果
资源获取:
表格的获取方式如下:
通过网盘分享的文件:学生成绩表.zip
链接: https://pan.baidu.com/s/1k-Km-Alo3x73QQfSLYQBYw?pwd=rsx7 提取码: rsx7
--来自百度网盘超级会员v5的分享
好啦,希望能够帮助到大家!