皮尔逊(Pearson)相关系数与spearman相关系数(Python实现)

概念介绍

相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。
相关系数大小解释

相关性绝对值
无相关0 - 0.09
弱相关0.1 - 0.3
中相关0.3 - 0.5
强相关0.5 - 1

表中所定的标准从某种意义上说是武断的和不严格的。
对相关系数的解释是依赖于具体的应用背景和目的。

Pearson(皮尔逊)相关系数

简介:皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

公式
在这里插入图片描述
也可以化简为
在这里插入图片描述

适用范围

  • 两个变量之间是线性关系,都是连续数据。
  • 两个变量的总体是正态分布,或接近正态的单峰分布。
  • 两个变量的观测值是成对的,每对观测值之间相互独立。

总结起来为三个关键词:【连续数据】、【正态分布】、【线性关系】

若不满足以上任一条件,则使用spearman相关系数

spearman相关系数在这里插入图片描述
Python实现
#导入包
import pandas as pd
import matplotlib.pyplot as plt

#导入数据
dates = pd.read_csv(r"C:\Users\八年级女生体测数据.csv",encoding='gbk')
#查看开头几行数据
dates.head()

在这里插入图片描述
在使用相关系数之前要画出变量之间的散点,观察是否为线性关系
这里用的数据是随机生成的,不符合规律,仅用于练习,在数学建模中不会出现这种数据的。

X0 = dates.iloc[:]['身高']
X1 = dates.iloc[:]['体重']
X2 = dates.iloc[:]['肺活量']
#画出身高与体重的散点图
plt.scatter(X0,X1)

在这里插入图片描述

date = dates[['身高','体重','肺活量','50米跑','立定跳远','坐位体前屈']]
date.corr()#计算皮尔逊相关系数

在这里插入图片描述

date.corr('spearman')#计算spearman相关系数

在这里插入图片描述

相关数据及MATLAB代码

相关数据和代码已经放在了【茶谈大数据】公众号

参考内容

https://blog.csdn.net/qq_30142403
https://blog.csdn.net/weixin_43172660

  • 9
    点赞
  • 101
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

茶冻茶茶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值