Python进行相关性分析并绘制热力图

本文介绍了在Python中使用pandas的corr()方法进行变量间相关性分析,包括皮尔逊、斯皮尔曼和肯德尔三种方法。通过示例展示了如何生成相关性热力图,并利用Seaborn的heatmap()函数,同时提到了不同的颜色映射(cmap)选项。
摘要由CSDN通过智能技术生成

本文仅本垃圾经验,欢迎大佬纠错。

在数据分析时,经常会针对两个变量进行相关性分析。在Python中主要用到的方法是pandas中的corr()方法。
corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame

corr()参数有三种,皮尔逊,斯皮尔曼,肯德尔,具体如下:

  • pearson:相关系数来衡量两个数据集合是否在一条线上面,即针对线性数据的相关系数计算,针对非线性数据便会有误差。
  • spearman:非线性的,非正态分析的数据的相关系数。
  • kendall:用于反映分类变量相关性的指标,即针对无序序列的相关系数,非正态分布的数据。

通过method方法选择相关性方法,即:

df.corr(method='spearman')

 一个示例:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['fo
  • 2
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值