简介
数据可视化是让我们感知数据的一种重要手段,通过不同的数据可视化的方式,使得我们可以在不同维度去理解当前的数据。
数据可视化的基本原理就是,人脑对色块的敏感性远大于数字,从演化论角度来讲,可以很好的分辨出不同颜色事物的祖先更容易活下来,而数字,那个时候并没有,所以进化而来的大脑并不擅长处理数字,进而对干巴巴的数据不敏感。
本章内容会提供代码以及相应的数据,公众号回复:Data1 则可获得。
Matplotlib 简单概念
Matplotlib 是 Python 中用于绘制二维图形的知名第三方库 (如果要绘制三维图形,需要额外安装一些支持包),也是很多几天高层次数据可视化第三方库的基础支持库。
Matplotlib 中绘制的图有下面集中元素:
解释一下:
Major tick:主线
Minor tick:线上的刻度
Major tick label:主线上的标签
Title:整个图的标题
Legend:标注
Y axis label:Y 轴的标签
Line:绘制的线
Grid:网格
Markers:标记
Figure:图形
Axes:轴域
上图就是 Matplotlib 绘制的整个窗口,图中包含了实际图表、x 轴、y 轴以及每个轴对应的标题、刻度和标签。在 Matplotlib 中可以为图形添加多个轴域,具体而言,就是使用 pyplot 来创建多个轴域并改变其形状。
这里可能会疑惑,Figure、Axes 与 Axis 之间有什么关系?特别是 Axes 与 Axis,英文直译都称为轴,可以通过一张图解释三者的关系。
绘制图像的常见步骤
大多数时候,使用 Matplotlib 绘制数据的流程是类似的,虽然有些特殊的图像绘制需要一下特殊的操作,但大体流程都相似
1. 通过 Pandas 将要绘制图像的数据读入,如 pd.readcsv () 读入 csv 文件数据、pd.readexcel () 读取 Excel 文件数据
2. 导入 Matplotlib , 具体为: import matplotlib.pyplot as plt
3. 使用 plt.plot () 绘制折线图,不同的图使用不同的绘图函数,所有的绘图函数都需要传入相应的数据
4. 使用 plt.xlabel 与 plt.ylabel 定义 x 轴与 y 轴的标签,如定义标签字体样式、字体大小、字段位置等待,如果不使用,Matplo