Python 数据可视化分析（二）

最新推荐文章于 2024-06-26 10:32:11 发布

码农米格

最新推荐文章于 2024-06-26 10:32:11 发布

阅读量553

点赞数

分类专栏：人工智能 python 文章标签：数据挖掘机器学习 python

本文链接：https://blog.csdn.net/e_mmm0629/article/details/105590968

版权

本文介绍了Python数据可视化分析的第二部分，涉及多标量可视化，包括相关矩阵和散点图的绘制，以及如何通过seaborn库深入分析数据。还探讨了交叉表在类别分析中的应用，以及全局数据集的降维方法——t-SNE，用于在保持信息完整性的同时降低数据维度。最后，通过实验总结强调了可视化在数据挖掘中的重要性。

摘要由CSDN通过智能技术生成

Python 数据可视化分析（二）

多标量可视化

在单张图像中查看两个以上变量的联系

相关矩阵：可揭示数据集中的数值变量的相关性。
使用corr()放大计算出特征间的相关性，然后将所得到的的相关矩阵传给seaborn的heatmap()方法，然后根据提供的值渲染出一个基于色彩编码的矩阵

    # 删除非数值变量
    numerical =list(set(df.columns) - set(['字段名'])) # 字段名可以使多个，用逗号隔开
    # 计算和绘图
    corr_matrix = df[numerical].corr()
    sns.heatmap(corr_matrix)