数据可视化
介绍
通常数据可视化,可以帮助我们寻找一些异常值(过大或过小的值)、进行数据转换(数据标准化)、判断可使用的模型等。
这里主要介绍matplotlib和seaborn
matplotlib
导入:import matplotlib.pyplot as plt
在jupyter notebook中使用需要使用%matplotlib inline,在IPython中使用%matplotlib
Figure和Subplot
matplotlib的图像都是基于Figure对象,但是我们的图像是基于subplot进行绘制的,使用fig.add_subplot对象返回的是AxesSubplot对象,可以在该对象中使用方法进行绘图。
可以使用plt.subplots()快速创建fig和axes对象,其中的axes以numpy数组表示
接下来介绍的就是subplot对象和Figure对象中的各种方法,如下:
- 间距:plt.subplots_adjust
- 颜色、标记和线型:通过axesSubplot.plot()中的参数设置
- 刻度、标签和图例:plt.xlim, plt.xticks, plt.xticklabels
- 添加图例:使用ax.plot方法中的label参数,然后调用legend方法自动创建图例
- 注解和在Subplot上绘图:ax.annotable()方法、Series.plot(ax=ax, style=‘k-’)
- 图表保存:plt.savefig
seaborn
在未使用seaborn之前,给Series或DataFrame画图,需要自行对数据进行处理,然后调用plot进行绘图。
使用了seaborn之后,可以简化操作,只需要填写对应的参数即可,可以减少工作量
具体的方法,在jupyter notebook中直接使用帮助信息查看学习即可。