matplotlib 是基于python的一款可视化神器,类似于 ggplot2
,它基本能涵盖常见的一些图形。同时得益于强大的python社区支持,这个包的功能也在不断增加。有时候写多了python,再写R,一时半会还想不起代码咋写。同时python中用于统计的包也比较全面,自己对python了解的还是多一些,准备在数据可视化方面用matplotlib
。
matplotlib支持一些常见的图形例如:
线图;
散点图;
等高线图;
条形图;
柱状图;
3D 图形,
甚至是图形动画等等.
官网网页
https://matplotlib.org/
学习视频教程: 莫烦的
https://morvanzhou.github.io/tutorials/data-manipulation/plt/1-1-why/
话不多说,先上几张漂亮的图片,压压场
安装
使用
pip
安装
python -m pip install -U pippython -m pip install -U matplotlib
#pip install matplotlib --user#引入matplotlib包import matplotlib.pyplot as pltimport numpy as np
fig, ax = plt.subplots() # Create a figure containing a single axes.ax.plot([1, 2, 3, 4], [1, 4, 2, 3]) # Plot some data on the axes.
plt.subplots()
函数返回两个对象
fig 图形对象
ax 坐标轴对象
当然如果不需要操作坐标轴的话,也可以直接使用plot
函数
plt.plot([2,3,5,6],[2,4,5,6])plt.plot([2,3,5,6],[2,4,5,6]) #直接使用plot函数
更加深入的理解图片的构造
figure=plt.figure() ##没有坐标轴的空白图片,啥也看不到fig,ax=plt.subplots() ##带坐标轴的空白图片,只有单个坐标轴
fig,axs=plt.subplots(2,2) ##2x2的四坐标轴图片
Axes对象
通常Axes就是包含data的一个图片
一张figure可以有多个Axes
而一个Axes只属于某一个figure
Axes包含有两个或者3个Axis(坐标轴)
Axes类似于ggplot分面中的一个分面
对坐标轴中显示数据范围的控制
axes.Axes.set_xlim() ##控制X轴显示范围axes.Axes.set_ylim() ##控制y轴显示范围
控制坐标轴标签与图形标签
axes.Axes.set_title() ##图片标签axes.Axes.set_xlabel() ##x轴标签axes.Axes.set_ylabel() ##y轴标签
控制图例名称和显示图例
axes.plot(data,label="图例名")axes.legend()
import matplotlibimport matplotlib.pyplot as pltmatplotlib.use('qt5agg')fig,axs=plt.subplots(2,1) ## 绘制2X1 图片axs[0].plot([1,2,3,4],[4,5,6,7],label="liner1") #第一张图,以及图例axs[0].plot([2,4,5,6],[4,5,6,7],label="liner2") #第一张图,以及图例axs[1].plot([1,6,7,8],[5,6,7,8],label="test") # 第二张图 以及图例for item in axs: #批量设置标题 和图例 item.set_xlim(0,10) item.set_xlabel('x label') item.set_ylabel('y label') item.set_title('test') item.legend()plt.savefig("test.png")
Axis对象
用于设置坐标轴范围
控制坐标轴上显示的标记,
Locator
对象控制坐标轴上显示的字符
Formatter
对象
Artist
基本上所有的figure都会用到Artist对象,并且Artist是与Axes对象绑定在一起使用的。Artist对象就包含以下几个对象
Text
Line2D
collection
Patch
输入数据格式
所有的绘图数据都是基于numpy.array
类型进行的,当然有些类似array的数据类型,例如pandas
中的dataFrame,numpy
中的matrix;这些数据类型作为输入数据时,可能不能够正常的工作,所有还是将它们转换成numpy.array
之后再绘制图片吧
将panda 数据框转换
import numpy as npimport pandasa=pandas.DataFrame(np.random.rand(4,5), columns = list('abcde')) ##获取4x5的随机数据框print(a) a b c d e0 0.505938 0.742418 0.732312 0.008823 0.5592011 0.834437 0.657429 0.136503 0.654495 0.8418732 0.725788 0.746307 0.240214 0.732954 0.1197963 0.452142 0.172521 0.103506 0.472862 0.744575a_array=a.valuesprint(a) ##看起来没变化,实质上一个是数据框,一个是数组 a b c d e0 0.505938 0.742418 0.732312 0.008823 0.5592011 0.834437 0.657429 0.136503 0.654495 0.8418732 0.725788 0.746307 0.240214 0.732954 0.1197963 0.452142 0.172521 0.103506 0.472862 0.744575
将numpy.matrix转换
import numpy as npb = np.matrix([[1, 2], [3, 4]])print(b)[[1 2] [3 4]]b_asarray = np.asarray(b)print(b)[[1 2] [3 4]]
pyplot两种绘图方式
面向对象的方式
这种在写脚本的时候,可以封装成函数,在不修改代码的情况下,仅仅改变数据就可以获得不同的图片。用的比较多;不涉及与用户的交互
import matplotlib.pyplot as pltx=np.linspace(0, 2, 100)fig,ax=plt.subplots()ax.plot(x,x,label='liner')ax.legend()
直接调用pyplot方法
这个有点类似ggplot2,在jupyter中用的频繁。不过个人还是比较喜欢用第一种面向对象的方式,毕竟对象嘛..
import matplotlib.pyplot as pltx=np.linspace(0, 2, 100)plt.plot(x,x,label="liner")plt.legend()
还有第三种,之后遇到在看吧
如何导出图片
文档里用了一个词BacKends
,意思就是针对不同的需求,导出不同类型的图片
AGG 支持png
PS 支持ps、eps
PDF 支持pdf
SVG 支持svg
Cairo 支持png ps pdf svg
配置
一般来说不用配置,能够根据系统自动检测,
linux中配置一下环境变量即可
$ export MPLBACKEND=qt5agg$ python simple_plot.py##或者$ MPLBACKEND=qt5agg python simple_plot.py
import matplotlibmatplotlib.use('qt5agg')##导出图片matplotlib.pyplot.savefig('filename')