三大相关性检验的介绍和选择

最新推荐文章于 2024-06-07 10:18:16 发布

Walter_Silva

最新推荐文章于 2024-06-07 10:18:16 发布

阅读量2.1w

点赞数 2

分类专栏：机器学习笔记集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gin077/article/details/84024439

版权

机器学习笔记集同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

机器学习教程

15 篇文章 0 订阅

订阅专栏

https://blog.csdn.net/sinat_24143931/article/details/78798630

根据这篇文章的介绍可以知道：

1、person correlation coefficient（皮尔森相关性系数）

就是两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。

它要求数据是连续数据、正态分布且线性关系

2、spearman correlation coefficient（斯皮尔曼相关性系数）

根据秩来计算，没有皮尔森相关性系数对数据那么严格的限制条件，而且，即便在变量值没有变化的情况下，也不会出现像皮尔森系数那样分母为0而无法计算的情况。另外，即使出现异常值，由于异常值的秩次通常不会有明显的变化（比如过大或者过小，那要么排第一，要么排最后），所以对斯皮尔曼相关性系数的影响也非常小！这个我们可以多用

3、 kendall correlation coefficient（肯德尔相关性系数）

肯德尔相关性系数，又称肯德尔秩相关系数，它也是一种秩相关系数，不过它所计算的对象是分类变量。
分类变量可以理解成有类别的变量，可以分为
无序的，比如性别（男、女）、血型（A、B、O、AB）；
有序的，比如肥胖等级（重度肥胖，中度肥胖、轻度肥胖、不肥胖）。
通常需要求相关性系数的都是有序分类变量。

调用：

Pandas接口：

DataFrame.corr(method='pearson', min_periods=1)

method : {‘pearson’, ‘kendall’, ‘spearman’}

pearson : standard correlation coefficient
kendall : Kendall Tau correlation coefficient
spearman : Spearman rank correlation

min_periods : int, optional

Minimum number of observations required per pair of columns to have a valid result. Currently only available for pearson and spearman correlation

补充介绍：https://zhidao.baidu.com/question/942120591632351772.html

关注

2
点赞
踩
33

收藏

觉得还不错? 一键收藏
0
评论
三大相关性检验的介绍和选择

https://blog.csdn.net/sinat_24143931/article/details/78798630根据这篇文章的介绍可以知道：1、person correlation coefficient（皮尔森相关性系数）就是两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。它要求数据是连续数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。