python相关性分析及可视化

数据准备

需要一个类似excel文件的数据。进行每列字段之间的相关性分析。

计算

导入第三方库。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

进行计算

f_path = r'相关性.xlsx'
df = pd.read_excel(f_path)
corr = df.corr()
print(corr)

在这里插入图片描述

可视化

heatmap = sns.heatmap(corr)
plt.show()

在这里插入图片描述
如果发现中文字体有问题,只需要在最前面加上下面两句。

plt.rcParams['font.family'] = ['sans-serif']
plt.rcParams['font.sans-serif'] = ['SimHei']
对于 Python 中的相关性分析可视化,有几个常用的库和方法可以使用。 1. Pandas:Pandas 是一个强大的数据处理库,可以用于加载、处理和分析数据。它提供了一些函数来计算数据列之间的相关性,例如 `corr()` 函数。你可以使用 Pandas 提供的相关性函数来计算数据集中各个变量之间的相关性,并将结果可视化。 2. Matplotlib:Matplotlib 是一个广泛使用的绘图库,可以用于创建各种类型的图表,包括散点图、柱状图和热力图等。你可以使用 Matplotlib 中的函数来绘制相关性矩阵、散点图和其他类型的图表,以便可视化数据变量之间的相关性。 3. Seaborn:Seaborn 是基于 Matplotlib 的高级绘图库,提供了更简单的接口和更漂亮的默认样式。它提供了一些函数来绘制各种类型的统计图表,包括热力图、散点图和分布图等。你可以使用 Seaborn 来可视化相关性矩阵和其他与相关性分析相关的图表。 下面是一个简单的示例代码,演示如何使用 Pandas、Matplotlib 和 Seaborn 进行相关性分析可视化: ```python import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 加载数据 data = pd.read_csv('data.csv') # 计算相关性 correlation_matrix = data.corr() # 绘制相关性矩阵 plt.figure(figsize=(10, 8)) sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm') plt.title('Correlation Matrix') plt.show() # 绘制散点图 sns.scatterplot(x='x', y='y', data=data) plt.title('Scatter Plot') plt.show() ``` 请注意,上述代码中的 `'data.csv'` 是一个包含你要分析的数据的 CSV 文件路径。你需要将其替换为你自己的数据文件路径。另外,你还可以根据需要调整图表的大小、颜色映射和其他绘图参数。 希望这个示例能帮助你开始进行 Python 中的相关性分析可视化。如果你有更多具体的问题,请随时提问!
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wei *

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值