4种更快更简单实现 Python 数据可视化的方法

理想程序员二号

于 2024-04-28 16:32:09 发布

阅读量701

点赞数 25

分类专栏：程序员文章标签：信息可视化 python 开发语言

本文链接：https://blog.csdn.net/m0_60749700/article/details/138282941

版权

程序员专栏收录该内容

187 篇文章 1 订阅

订阅专栏

二维密度图

二维密度图（2D Density Plot）是一维版本密度图的直观扩展，相对于一维版本，其优点是能够看到关于两个变量的概率分布。例如，在下面的二维密度图中，右边的刻度图用颜色表示每个点的概率。我们的数据出现概率最大的地方（也就是数据点最集中的地方），似乎在 size=0.5，speed=1.4 左右。正如你现在所知道的，二维密度图对于迅速找出我们的数据在两个变量的情况下最集中的区域非常有用，而不是像一维密度图那样只有一个变量。当你有两个对输出非常重要的变量，并且希望了解它们如何共同作用于输出的分布时，用二维密度图观察数据是十分有效的。

在这里插入图片描述

事实再次证明，使用「seaborn」编写代码是十分便捷的！这一次，我们将创建一个偏态分布，让数据可视化结果更有趣。你可以对大多数可选参数进行调整，让可视化看结果看起来更清楚。

import seaborn as sns

import matplotlib.pyplot as plt

from scipy.stats import skewnorm

Create the data

speed = skewnorm.rvs(4, size=50)

size = skewnorm.rvs(4, size=50)

Create and shor the 2D Density plot

ax = sns.kdeplot(speed, size, cmap=“Reds”, shade=False, bw=.15, cbar=True)

ax.set(xlabel=‘speed’, ylabel=‘size’)

plt.show()

蜘蛛网图

蜘蛛网图（Spider Plot）是显示一对多关系的最佳方法之一。换而言之，你可以绘制并查看多个与某个变量或类别相关的变量的值。在蜘蛛网图中，一个变量相对于另一个变量的显著性是清晰而明显的，因为在特定的方向上，覆盖的面积和距离中心的长度变得更大。如果你想看看利用这些变量描述的几个不同类别的对象有何不同，可以将它们并排绘制。在下面的图表中，我们很容易比较复仇者联盟的不同属性，并看到他们各自的优势所在！（请注意，这些数据是随机设置的，我对复仇者联盟的成员们没有偏见。）

在这里插入图片描述

在这里，我们可以直接使用「matplotlib」而非「seaborn」来创建可视化结果。我们需要让每个属性沿圆周等距分布。我们将在每个角上设置标签，然后将值绘制为一个点，它到中心的距离取决于它的值/大小。最后，为了显示更清晰，我们将使用半透明的颜色来填充将属性点连接起来得到的线条所包围的区域。

import pandas as pd

import seaborn as sns

import numpy as np

import matplotlib.pyplot as plt

Get the data

df=pd.read_csv(“avengers_data.csv”)

print(df)

“”"

Name Attack Defense Speed Range Health

0 1 Iron Man 83 80 75 70 70

1 2 Captain America 60 62 63 80 80

2 3 Thor 80 82 83 100 100

3 3 Hulk 80 100 67 44 92

4 4 Black Widow 52 43 60 50 65

5 5 Hawkeye 58 64 58 80 65

“”"

Get the data for Iron Man

labels=np.array([“Attack”,“Defense”,“Speed”,“Range”,“Health”])

stats=df.loc[0,labels].values

Make some calculations for the plot

angles=np.linspace(0, 2*np.pi, len(labels), endpoint=False)

stats=np.concatenate((stats,[stats[0]]))

angles=np.concatenate((angles,[angles[0]]))

Plot stuff

fig = plt.figure()

ax = fig.add_subplot(111, polar=True)

ax.plot(angles, stats, ‘o-’, linewidth=2)

ax.fill(angles, stats, alpha=0.25)

ax.set_thetagrids(angles * 180/np.pi, labels)

ax.set_title([df.loc[0,“Name”]])

ax.grid(True)

plt.show()

树状图

我们从小学就开始使用树状图（Tree Diagram）了！树状图是自然而直观的，这使它们容易被解释。直接相连的节点关系密切，而具有多个连接的节点则不太相似。在下面的可视化结果中，我根据 Kaggle 的统计数据（生命值、攻击力、防御力、特殊攻击、特殊防御、速度）绘制了一小部分口袋妖怪游戏的数据集的树状图。

因此，统计意义上最匹配的口袋妖怪将被紧密地连接在一起。例如，在图的顶部，阿柏怪和尖嘴鸟是直接连接的，如果我们查看数据，阿柏怪的总分为 438，尖嘴鸟则为 442，二者非常接近！但是如果我们看看拉达，我们可以看到其总得分为 413，这和阿柏怪、尖嘴鸟就具有较大差别了，所以它们在树状图中是被分开的！当我们沿着树往上移动时，绿色组的口袋妖怪彼此之间比它们和红色组中的任何口袋妖怪都更相似，即使这里并没有直接的绿色的连接。

在这里插入图片描述

对于树状图，我们实际上需要使用「Scipy」来绘制！读取数据集中的数据之后，我们将删除字符串列。这么做只是为了使可视化结果更加直观、便于理解，但在实践中，将这些字符串转换为分类变量会得到更好的结果和对比效果。我们还设置了数据帧的索引，以便能够恰当地将其用作引用每个节点的列。最后需要告诉大家的是，在「Scipy」中计算和绘制树状图只需要一行简单的代码。

import pandas as pd

如果你也是看准了Python，想自学Python，在这里为大家准备了丰厚的免费学习大礼包，带大家一起学习，给大家剖析Python兼职、就业行情前景的这些事儿。

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

二、学习软件

工欲善其必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。

四、入门学习视频

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

五、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

成为一个Python程序员专家或许需要花费数年时间，但是打下坚实的基础只要几周就可以，如果你按照我提供的学习路线以及资料有意识地去实践，你就有很大可能成功！
最后祝你好运！！！

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里无偿获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

理想程序员二号

关注

25
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
4种更快更简单实现 Python 数据可视化的方法

二维密度图二维密度图（2D Density Plot）是一维版本密度图的直观扩展，相对于一维版本，其优点是能够看到关于两个变量的概率分布。例如，在下面的二维密度图中，右边的刻度图用颜色表示每个点的概率。我们的数据出现概率最大的地方（也就是数据点最集中的地方），似乎在 size=0.5，speed=1.4 左右。正如你现在所知道的，二维密度图对于迅速找出我们的数据在两个变量的情况下最集中的区域非常有用，而不是像一维密度图那样只有一个变量。
复制链接

扫一扫