在pandas的corr()函数中,不同的计算相关性的参数主要用于处理不同的数据和不同的场景。
1、pearson:这是默认参数,用于计算皮尔逊相关系数。皮尔逊相关系数主要用于度量两个变量之间的线性相关性。如果你的数据是线性相关的,那么使用皮尔逊相关系数是一个不错的选择。
2、kendall:这个参数用于计算肯德尔相关系数。肯德尔相关系数主要用于度量两个变量之间的顺序关系,它可以处理非线性数据,但是它不能处理缺失值。
3、spearman:这个参数用于计算斯皮尔曼相关系数。斯皮尔曼相关系数主要用于度量两个变量之间的相关性,它也可以处理非线性数据,但是它不能处理缺失值。
附上一个使用corr计算相关性的热力图方法博客:
相关性热力图