Python 数据可视化分析(二)
多标量可视化
在单张图像中查看两个以上变量的联系
- 相关矩阵:可揭示数据集中的数值变量的相关性。
- 使用
corr()
放大计算出特征间的相关性,然后将所得到的的相关矩阵传给seaborn的heatmap()
方法,然后根据提供的值渲染出一个基于色彩编码的矩阵
# 删除非数值变量
numerical =list(set(df.columns) - set(['字段名'])) # 字段名可以使多个,用逗号隔开
# 计算和绘图
corr_matrix = df[numerical].corr()
sns.heatmap(corr_matrix)
- 散点图:将两个数值变量的值显示为二维空间中的笛卡尔坐标,通过matplotlib库的
scatter()
方法创建
plt.scatter(df['字段名1'