原创: 未明学院
数据可视化,以数据为工具,以可视化为手段,这是数据分析中的重要一环。
因为大部分用户对于数据并非内行,利用漂亮的可视化可以吸引他们的注意,另一方面,通过可视化将数据中的信息进行提取,简单易懂,用户才能理解数据的内涵。所以根据数据的逻辑关系,选择合适的图形,精准的进行数据信息传达,是大家普遍关注的。
我们借鉴可视化专家Andrew Abela对数据关系所进行的总结,将图表展示的数据关系分为四类:比较、分布、构成和联系。
本文旨在总结四种不同数据逻辑关系下的常见图表,利用Python中最基础的matplotlib和seaborn库进行操作。
小明提醒:点击图片查看大图,看代码更清晰
分布
数据分析前期,对样本数据做统计量分析非常关键的就是做分布分析;其中,直方图、密度图,散点图都是常用形式。
直方图、密度图主要看整个变量数据分布的情况,散点图可以看到两个维度分布的情况。
1、直方图
2、密度图
3、直方密度图
4、箱型图
5、分布包点图
6、小提琴图
7、分类图
8、发散条形图
9、发散型文本
10、发散型棒棒糖
联系
联系类型图表用于展示数据之间的关系,并且可以查找数据间的相关性、异常值和数据集群。
1、散点图
2、气泡图
3、带拟合线的散点图
4、边缘直方图1
5、边缘直方图2
6、相关图
7、矩阵图
以上就是分布和联系关系下的常见图表形式,有关比较、构成的内容,请锁定下期推文!