Matplotlib 是一个 Python 的 2D绘图库,由各种可视化类构成,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。matplotlib.pylot是绘制各类可视化图形的命令子库,相当于快捷方式。导包:import matplotlib.pylot as plt
绘图基础语法与常用参数
1、创建画布与创建子图
函数 | 函数作用 |
---|---|
plt.figure | 创建一个空白画布,可以指定画布大小、像素 |
figure.add_subplot | 创建并选中子图,可以指定子图的行数,列数,与选中图片编号 |
2、pyplot的绘图区域
plt.subplot(nrows,ncols,plot_number)
plt.subplot(3,2,4) #将区域分成3行2列,取第4个区域绘图
plt.subplot(324) #和上面一个意思
在全局绘图区域中创建一个分区体系,并定位到一个子绘图区域。
import numpy as np
import matplotlib.pyplot as plt
def f(t):
return np.exp(-t)*np.cos(2*np.pi*t)
a=np.arange(0.0,5.0,0.02)
plt.subplot(211)
plt.plot(a,f(a))
plt.subplot(2,1,2)
plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.show()
复杂的网格区域
plt.subplot2grid(GridSpec, CurSepc, colspan=1, rowspan=1)
理念:设定网格,选中网格,确定选中行列区域数量,编号从0开始。
例如,plt.subplot2grid((3,3), (1,0), colspan=2) 表示将区域划分为3行3列,选中(1,0)位置,然后选择2列,就是下图中的ax2区域。
GridSpec类的一些方法在绘制复杂的网格区域时更为方便。例如上面的网格分布可以用下面的代码实现。
import matplotlib.gridspec as gridspec
gs=gridspec.GridSpec(3,3)#整块区域形成3行3列
ax1=plt.subplot(gs[0,:])
ax2=plt.subplot(gs[1,:-1])
ax3=plt.subplot(gs[1:,-1])
ax4=plt.subplot(gs[2,0])
ax5=plt.subplot(gs[2,1])
3、pyplot的文本显示函数
函数 | 说明 |
---|---|
plt.xlabel() | 对X轴增加文本标签 |
plt.ylabel() | 对Y轴增加文本标签 |
plt.title() | 对图形整体增加文本标签 |
plt.text() | 在任意位置增加文本 |
plt.annotate() | 在图形中增加带箭头的注解 |
import matplotlib.pyplot as plt
import numpy as np
a=np.arange(0.0,5.0,0.02)
plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=15,color='green')
plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=15)
plt.title(r'正弦波实例$y=cos(2\pi x)$',fontproperties='SimHei',fontsize=25)
#$y=cos(2\pi x)$是LaTeX语法
plt.text(2,1,r'$\mu=100$',fontsize=15)#显示在横轴为2纵轴为1的位置
plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.axis([-1,6,-2,2])
plt.grid(True)#网格
plt.show()
4、plot函数
plt.plot(x,y,format_string,**kwargs)
- x:X轴数据,列表或数组,可选。
- y:Y轴数据,列表或数组。
- format_string:控制曲线的格式字符串,可选。
由颜色、风格、标记字符组成。下表列举了几种常用的颜色字符,更多参考matplotlib相关文档。
颜色字符 | 说明 | 颜色字符 | 说明 |
---|---|---|---|
b | 蓝色 | m | 洋红色magenta |
g | 绿色 | y | 黄色 |
r | 红色 | k | 黑色 |
c | 青绿色cyan | w | 白色 |
#008000 | RGB某颜色 | 0.8 | 灰度值字符串 |
风格字符 | 说明 |
---|---|
‘-’ | 实线 |
‘–’ | 破折线 |
‘-.’ | 点划线 |
‘:’ | 点构成的虚线 |
‘’/’ '(空或空格) | 无线条 |
标记字符 | 说明 | 标记字符 | 说明 | 标记字符 | 说明 |
---|---|---|---|---|---|
‘.’ | 点标记 | ‘1’ | 下花三角标记 | ‘h’ | 竖六边形标记 |
‘,’ | 像素标记(极小点) | ‘2’ | 上花三角标记 | ‘H’ | 横六边形标记 |
‘o’ | 实心圈 | ‘3’ | 左花三角标记 | ‘+’ | 十字标记 |
‘v’ | 倒三角 | ‘4’ | 右花三角标记 | ‘x’ | x标记 |
‘^’ | 上三角 | ‘s’ | 实心方形标记 | ‘D’ | 菱形标记 |
‘>’ | 右三角 | ‘p’ | 实心五角 | ‘d’ | 瘦菱形标记 |
‘<’ | 左三角 | ‘*’ | 星形标记 | ‘|’ | 垂直线标记 |
- **kwargs:第二组或更多(x,y,format_string)
color:控制颜色,例如color=‘green’
linestyle:线条风格,linestyle=‘dashed’
marker:标记风格,marker=‘o’
markerfacecolor:标记颜色,markerfacecolor=‘blue’
markersize:标记尺寸,markersize=20
……
示例:
import matplotlib.pyplot as plt
plt.plot([3,1,4,5,2])
plt.ylabel("Grade")
plt.savefig('test',dpi=600)#将输出图形保存为test.png文件,可以通过dpi修改输出质量
plt.show()
plt.plot(x,y)当有两个以上参数时,按照X轴和Y轴顺序绘制数据点。
import matplotlib.pyplot as plt
plt.plot([0,2,4,6,8],[3,1,4,5,2])#两个参数分别表示X轴和Y轴的数据点
plt.ylabel("Grade")
plt.axis([-1,10,0,6])#四个参数分别表示X轴和Y轴的起始
plt.show()
当绘制多条曲线时,各条曲线的x不能省略。
a=np.arange(10)
plt.plot(a,a*1.5,'go-',a,a*2.5,'rx',a,a*3.5,'*',a,a*4.5,'b-.')
plt.show()
5、添加画布内容
函数 | 函数作用 |
---|---|
plt.title | 添加标题,可以指定标题的名称、位置、颜色、字体大小等参数 |
plt.xlabel | 添加x轴名称,可以指定位置、颜色、字体大小等参数 |
plt.ylabel | 添加y轴名称,可以指定位置、颜色、字体大小等参数 |
plt.xlim | 指定x轴的范围,只能确定一个数值区间,而无法使用字符串标识 |
plt.ylim | 指定y轴的范围,只能确定一个数值区间,而无法使用字符串标识 |
plt.xticks | 指定x轴刻度的数目与取值 |
plt.yticks | 指定y轴刻度的数目与取值 |
plt.legend | 指定当前图形的图例,可以指定图例的大小、位置、标签 |
6、保存与展示图形
函数 | 函数作用 |
---|---|
plt.savafig() | 保存绘制的图片,可以指定图片的分辨率、边缘的颜色等参数 |
plt.show() | 在本机显示图形 |
7、pyplot的动态rc参数
pyplot使用rc配置文件来自定义图形的各种默认属性,被称为rc配置或rc参数。
在pyplot中几乎所有的默认属性都是可以控制的,例如视图窗口大小以及每英寸点数、线条宽度、颜色和样式、坐标轴、坐标和网格属性、文本、字体等。
线条的常用rc参数名称、解释与取值:
rc参数名称 | 解释 | 取值 |
---|---|---|
lines.linewidth | 线条宽度 | 取0-10之间的数值,默认为1.5 |
lines.linestyle | 线条样式 | 可取“-” “–” “-.” “:”四种默认为“-” |
lines.marker | 线条上点的形状 | 可取“o” “D” “h” “.” “,” “S”等20种,默认为None |
lines.markersize | 点的大小 | 取0-10之间的数值,默认为1 |
常用线条类型解释:
linestyle取值 | 意义 | linestyle取值 | 意义 |
---|---|---|---|
- | 实线 | -. | 点线 |
– | 长虚线 | : | 短虚线 |
线条标记解释:
由于默认的pyplot字体并不支持中文字符的显示,因此需要通过rcParams修改字体实现。同时,由于更改字体后,会导致坐标轴中的部分字符无法显示,因此需要同时更改axes.unicodes_minus参数。
rcParams的属性:
属性 | 说明 |
---|---|
‘font.family’ | 用于显示字体的名字 |
‘font.style’ | 字体风格,正常’normal’或斜体’italic’ |
‘font.size’ | 字体大小,整数字号或者’large’,‘x-small’ |
其中,rcParams[‘font.family’]
中文字体 | 说明 |
---|---|
‘SimHei’ | 中文黑体 |
‘Kaiti’ | 中文楷体 |
‘LiSu’ | 中文隶书 |
‘FangSong’ | 中文仿宋 |
‘YouYuan’ | 中文幼圆 |
‘STSong’ | 华文宋体 |
示例:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.family']='Kaiti'
matplotlib.rcParams['font.size']=20
matplotlib.rcParams['axes.unicode_minus']=False#使显示负号
a=np.arange(0.0,5.0,0.02)
plt.xlabel('横轴:时间')
plt.ylabel("纵轴:振幅")
plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.show()
这样会修改全局的中文样式,还有第二种中文显示的方法:在中文输出的地方,增加一个属性:fontproperties。这是一种对整个系统改变最少的方法。
例如下面的例子,横轴和纵轴的字体都变成了微软雅黑。
import matplotlib.pyplot as plt
import numpy as np
a=np.arange(0.0,5.0,0.02)
plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=20)
plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=20)
plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.show()
分析特征间的关系
pyplot的基础图标函数
散点图
matplotlib.pyplot.scatter(x, y, s=None, marker=None, alpha=None, **kwargs)
使用ax这种面向对象的方法进行绘图,pyplot里的函数变成了对象的方法。
import numpy as np
import matplotlib.pyplot as plt
fig,ax=plt.subplots()
ax.plot(10*np.random.randn(100),10*np.random.randn(100),'o')
ax.set_title('Simple Scatter')
plt.show()
折线图
matplotlib.pyplot.plot(*args, **kwargs)
plot函数在官方文档的语法中只要求填入不定长参数,实际可以填入的主要参数主要如下:
color参数的8种常用颜色的缩写:
b:蓝色;g:绿色;r:红色;c:青色;m:品红;y:黄色;k:黑色;w:白色
分析特征内部数据分布与分散
绘制直方图
直方图可以发现分布表无法发现的数据模式、样本的频率分布和总体的分布。
matplotlib.pyplot.bar(left, height, width=0.8, bottom=None, hold=None, data=None, **kwargs)
常用参数及说明如下表:
import numpy as np
import matplotlib.pyplot as plt
np.random.seed(0)
mu,sigma=100,20
a=np.random.normal(mu,sigma,size=100)#均值方差给定的正态分布数组a
plt.hist(a,20,density=1,histtype='stepfilled',facecolor='b',alpha=0.75)
#第2个参数bin,代表直立方形的个数
#每个直方图包含多少元素就是直方图的高度,
#density=0纵轴就是元素的个数,density=1纵轴就是元素出现的概率
#alpha代表透明度
plt.title('Histogram')
plt.show()
绘制饼图
matplotlib.pylot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None,radius=None,…)
常用参数及说明如下表:
示例:
import matplotlib.pyplot as plt
labels='Frogs','Hogs','Dogs','Logs'
sizes=[15,30,45,10]
explode=(0,0.1,0,0)#突出30那一块,突出比例0.1
plt.pie(sizes,explode=explode,labels=labels,
autopct='%1.1f%%',shadow=False,startangle=90)
#sizes饼图的尺寸,explode指出哪一块突出,labels给出每一块的标签,
#autopct显示百分数的方式,shadow带有阴影效果,startangle饼图的起始角度
plt.axis('equal')#正圆的饼图
plt.show()
绘制极坐标图
极坐标图在有关角度方面很有帮助。
示例如下:
import numpy as np
import matplotlib.pyplot as plt
N=20#极坐标图中数据的个数
theta=np.linspace(0.0,2*np.pi,N,endpoint=False)
radii=10*np.random.rand(N)
width=np.pi / 4*np.random.rand(N)
ax=plt.subplot(111,projection='polar')#面向对象绘图,当前绘制区域的对象是ax
bars=ax.bar(theta,radii,width=width,bottom=0.0)
#前3个参数分别为left绘图起始位置,height到圆心的高,width宽度
for r,bar in zip(radii,bars):
bar.set_facecolor(plt.cm.viridis(r/10.))
bar.set_alpha(0.5)
plt.show()
绘制箱线图
箱线图也称箱须图,其绘制需使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征时,更可表现其分散程度差异。
箱线图利用数据中的五个统计量(最小值、下四分位数、中位数、上四分位数和最大值)来描述数据,它可以粗略的看出数据是否具有对称性、分布的分散程度等信息,特别可以用于对几个样本的比较。
matplotlib.pyplot.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, meanline=None, labels=None,…)
常用参数及说明如下表: