原创: 未明学院
数据可视化,以数据为工具,以可视化为手段,这是数据分析中的重要一环。
因为大部分用户对于数据并非内行,利用漂亮的可视化可以吸引他们的注意,另一方面,通过可视化将数据中的信息进行提取,简单易懂,用户才能理解数据的内涵。所以根据数据的逻辑关系,选择合适的图形,精准的进行数据信息传达,是大家普遍关注的。
我们借鉴可视化专家Andrew Abela对数据关系所进行的总结,将图表展示的数据关系分为四类:比较、分布、构成和联系。
本文旨在总结四种不同数据逻辑关系下的常见图表,利用Python中最基础的matplotlib和seaborn库进行操作。
小明提醒:点击图片查看大图,看代码更清晰
分布
数据分析前期,对样本数据做统计量分析非常关键的就是做分布分析;其中,直方图、密度图,散点图都是常用形式。
直方图、密度图主要看整个变量数据分布的情况,散点图可以看到两个维度分布的情况。
1、直方图
2、密度图