目录
数据可视化时数据分析中的一部分,可用于数据的探索和查找缺失值等,也是展现数据的重要手段。matplotlib是一个强大的工具箱,其完整的图标样式函数和个性化的自定义设置,可以满足几乎所有的2D和一些3D绘图的需求。本章节介绍了如何利用matplotlib绘制常用数据图表,如线形图、柱状图、散点图和直方图;还介绍了如何使用matplotlib的自定义设置绘制个性化图表;最后使用全球星巴克店铺的数据进行数据分析和可视化。
6.1线形图
线形图是最基本的图标类型,常用于绘制连续的数据。通过绘制线形图,可以表现出数据的一种趋势变化。例如,公司通过绘制每个月份的产品销售量趋势图,来分析产品的销售情况,以此做出销售方式的调整。
6.1.1基本使用
matplotlib的plot函数可以用来绘制线形图,在参数中传入X轴和Y轴坐标即可。X轴和Y轴坐标的数据格式可以是列表、数组和Series。首先创建一个DataFrame数据,如下图
然后让DataFrame数据的行索引作为X轴,math列索引作为Y轴,开始绘制线形图。
6.1.2颜色与线条
通过plot函数的color参数可以指定线条颜色,这里绘制的是红色的线条,如下图
也可以指定RGB值来更改线条的颜色,如下图
注:完整的参数列表可以参考matplotlib官方文档。
通过plot函数的linestyle参数可以指定线条的形状,这里绘制出虚线的线条,如下图所示。
通过plot函数的linewidth参数可以指定线条的宽度,如图所示
6.1.3点标记
默认情况下,坐标点是没有标记的,通过plot函数的marker参数可对坐标点进行标记。如图
颜色、线条和点的样式可以一起放置于格式字符串中,但颜色设置要放在线条和点的样式前面如下图
6.2柱状图
6.2.1基本使用
绘制柱状图主要是使用matplotlib的bar函数。相比通过pandas绘制柱状图,通过matplotlib绘制柱状图的方法稍显复杂,需传入刻度列表和高度列表。如下图所示