![fdea409161e3aeae4590b9538f85ce25.png](https://i-blog.csdnimg.cn/blog_migrate/3983678405968ef3caf65799bf0b1b94.jpeg)
变量类型与推荐的假设检验方法
可以看到,当我们探索两个连续变量之间的关系时,相关分析是一个很好的选择。那么,相关分析的原理是什么?如何在Python中实现相关分析呢?
一、Pearson相关系数
针对两个独立的服从正态分布的连续变量,我们常用Pearson相关系数来衡量它们之间的相关性。Pearson相关系数的值域为[-1, 1],当相关系数小于0时,表明两变量之间存在线性负相关关系;当相关系数大于0时,表明两变量之间存在线性正相关关系;当相关系数等于0时,表明两变量之间无明显的相关关系。
当变量不符合正态分布或者是顺序型变量时,我们常用Spearman相关系数来衡量变量间的关系;当我们需要探索变量间的非线性关系时,可以使用Kendall相关系数。不过这些不在本篇的讨论范围内,如果感兴趣的人多,可以在下方留言。
一般情况下,我们用r来表示相关系数,r的取值与相关程度之间的关系如下:
![8d588f6c276fea30740e7dc5baed141d.png](https://i-blog.csdnimg.cn/blog_migrate/7ed4900472a52259faa4c2b3e9a70855.jpeg)