Matplotlib数据可视化

Matplotlib 是一个 Python 的 2D绘图库,由各种可视化类构成,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。matplotlib.pylot是绘制各类可视化图形的命令子库,相当于快捷方式。导包:import matplotlib.pylot as plt

绘图基础语法与常用参数

1、创建画布与创建子图

函数函数作用
plt.figure创建一个空白画布,可以指定画布大小、像素
figure.add_subplot创建并选中子图,可以指定子图的行数,列数,与选中图片编号

2、pyplot的绘图区域

plt.subplot(nrows,ncols,plot_number)
plt.subplot(3,2,4) #将区域分成3行2列,取第4个区域绘图
plt.subplot(324) #和上面一个意思
在这里插入图片描述
在全局绘图区域中创建一个分区体系,并定位到一个子绘图区域。

import numpy as np
import matplotlib.pyplot as plt
def f(t):
    return np.exp(-t)*np.cos(2*np.pi*t)
a=np.arange(0.0,5.0,0.02)
plt.subplot(211)
plt.plot(a,f(a))

plt.subplot(2,1,2)
plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.show()

在这里插入图片描述

复杂的网格区域

plt.subplot2grid(GridSpec, CurSepc, colspan=1, rowspan=1)

理念:设定网格,选中网格,确定选中行列区域数量,编号从0开始

例如,plt.subplot2grid((3,3), (1,0), colspan=2) 表示将区域划分为3行3列,选中(1,0)位置,然后选择2列,就是下图中的ax2区域。
在这里插入图片描述
GridSpec类的一些方法在绘制复杂的网格区域时更为方便。例如上面的网格分布可以用下面的代码实现。

import matplotlib.gridspec as gridspec
gs=gridspec.GridSpec(3,3)#整块区域形成3行3列

ax1=plt.subplot(gs[0,:])
ax2=plt.subplot(gs[1,:-1])
ax3=plt.subplot(gs[1:,-1])
ax4=plt.subplot(gs[2,0])
ax5=plt.subplot(gs[2,1])

3、pyplot的文本显示函数

函数说明
plt.xlabel()对X轴增加文本标签
plt.ylabel()对Y轴增加文本标签
plt.title()对图形整体增加文本标签
plt.text()在任意位置增加文本
plt.annotate()在图形中增加带箭头的注解
import matplotlib.pyplot as plt
import numpy as np

a=np.arange(0.0,5.0,0.02)

plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=15,color='green')
plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=15)
plt.title(r'正弦波实例$y=cos(2\pi x)$',fontproperties='SimHei',fontsize=25)
#$y=cos(2\pi x)$是LaTeX语法
plt.text(2,1,r'$\mu=100$',fontsize=15)#显示在横轴为2纵轴为1的位置

plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.axis([-1,6,-2,2])
plt.grid(True)#网格
plt.show()

在这里插入图片描述

4、plot函数

plt.plot(x,y,format_string,**kwargs)

  • x:X轴数据,列表或数组,可选。
  • y:Y轴数据,列表或数组。
  • format_string:控制曲线的格式字符串,可选。
    由颜色、风格、标记字符组成。下表列举了几种常用的颜色字符,更多参考matplotlib相关文档。
颜色字符说明颜色字符说明
b蓝色m洋红色magenta
g绿色y黄色
r红色k黑色
c青绿色cyanw白色
#008000RGB某颜色0.8灰度值字符串
风格字符说明
‘-’实线
‘–’破折线
‘-.’点划线
‘:’点构成的虚线
‘’/’ '(空或空格)无线条
标记字符说明标记字符说明标记字符说明
‘.’点标记‘1’下花三角标记‘h’竖六边形标记
‘,’像素标记(极小点)‘2’上花三角标记‘H’横六边形标记
‘o’实心圈‘3’左花三角标记‘+’十字标记
‘v’倒三角‘4’右花三角标记‘x’x标记
‘^’上三角‘s’实心方形标记‘D’菱形标记
‘>’右三角‘p’实心五角‘d’瘦菱形标记
‘<’左三角‘*’星形标记‘|’垂直线标记
  • **kwargs:第二组或更多(x,y,format_string)
    color:控制颜色,例如color=‘green’
    linestyle:线条风格,linestyle=‘dashed’
    marker:标记风格,marker=‘o’
    markerfacecolor:标记颜色,markerfacecolor=‘blue’
    markersize:标记尺寸,markersize=20
    ……

示例:

import matplotlib.pyplot as plt
plt.plot([3,1,4,5,2])
plt.ylabel("Grade")
plt.savefig('test',dpi=600)#将输出图形保存为test.png文件,可以通过dpi修改输出质量
plt.show()

在这里插入图片描述
plt.plot(x,y)当有两个以上参数时,按照X轴和Y轴顺序绘制数据点。

import matplotlib.pyplot as plt
plt.plot([0,2,4,6,8],[3,1,4,5,2])#两个参数分别表示X轴和Y轴的数据点
plt.ylabel("Grade")
plt.axis([-1,10,0,6])#四个参数分别表示X轴和Y轴的起始
plt.show()

在这里插入图片描述

当绘制多条曲线时,各条曲线的x不能省略。

a=np.arange(10)
plt.plot(a,a*1.5,'go-',a,a*2.5,'rx',a,a*3.5,'*',a,a*4.5,'b-.')
plt.show()

在这里插入图片描述

5、添加画布内容

函数函数作用
plt.title添加标题,可以指定标题的名称、位置、颜色、字体大小等参数
plt.xlabel添加x轴名称,可以指定位置、颜色、字体大小等参数
plt.ylabel添加y轴名称,可以指定位置、颜色、字体大小等参数
plt.xlim指定x轴的范围,只能确定一个数值区间,而无法使用字符串标识
plt.ylim指定y轴的范围,只能确定一个数值区间,而无法使用字符串标识
plt.xticks指定x轴刻度的数目与取值
plt.yticks指定y轴刻度的数目与取值
plt.legend指定当前图形的图例,可以指定图例的大小、位置、标签

6、保存与展示图形

函数函数作用
plt.savafig()保存绘制的图片,可以指定图片的分辨率、边缘的颜色等参数
plt.show()在本机显示图形

7、pyplot的动态rc参数

pyplot使用rc配置文件来自定义图形的各种默认属性,被称为rc配置或rc参数。
在pyplot中几乎所有的默认属性都是可以控制的,例如视图窗口大小以及每英寸点数、线条宽度、颜色和样式、坐标轴、坐标和网格属性、文本、字体等。

线条的常用rc参数名称、解释与取值:

rc参数名称解释取值
lines.linewidth线条宽度取0-10之间的数值,默认为1.5
lines.linestyle线条样式可取“-” “–” “-.” “:”四种默认为“-”
lines.marker线条上点的形状可取“o” “D” “h” “.” “,” “S”等20种,默认为None
lines.markersize点的大小取0-10之间的数值,默认为1

常用线条类型解释:

linestyle取值意义linestyle取值意义
-实线-.点线
长虚线短虚线

线条标记解释:
在这里插入图片描述
由于默认的pyplot字体并不支持中文字符的显示,因此需要通过rcParams修改字体实现。同时,由于更改字体后,会导致坐标轴中的部分字符无法显示,因此需要同时更改axes.unicodes_minus参数

rcParams的属性:

属性说明
‘font.family’用于显示字体的名字
‘font.style’字体风格,正常’normal’或斜体’italic’
‘font.size’字体大小,整数字号或者’large’,‘x-small’

其中,rcParams[‘font.family’]

中文字体说明
‘SimHei’中文黑体
‘Kaiti’中文楷体
‘LiSu’中文隶书
‘FangSong’中文仿宋
‘YouYuan’中文幼圆
‘STSong’华文宋体

示例:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib

matplotlib.rcParams['font.family']='Kaiti'
matplotlib.rcParams['font.size']=20
matplotlib.rcParams['axes.unicode_minus']=False#使显示负号

a=np.arange(0.0,5.0,0.02)

plt.xlabel('横轴:时间')
plt.ylabel("纵轴:振幅")

plt.plot(a,np.cos(2*np.pi*a),'r--')#虚线画出
plt.show()

在这里插入图片描述

这样会修改全局的中文样式,还有第二种中文显示的方法:在中文输出的地方,增加一个属性:fontproperties。这是一种对整个系统改变最少的方法。

例如下面的例子,横轴和纵轴的字体都变成了微软雅黑。

import matplotlib.pyplot as plt
import numpy as np

a=np.arange(0.0,5.0,0.02)

plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=20)
plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=20)

plt.plot(a,np.cos(2*np.pi*a),'r--')
plt.show()

在这里插入图片描述

分析特征间的关系

pyplot的基础图标函数

在这里插入图片描述在这里插入图片描述在这里插入图片描述

散点图

matplotlib.pyplot.scatter(x, y, s=None, marker=None, alpha=None, **kwargs)
在这里插入图片描述
使用ax这种面向对象的方法进行绘图,pyplot里的函数变成了对象的方法。

import numpy as np
import matplotlib.pyplot as plt

fig,ax=plt.subplots()
ax.plot(10*np.random.randn(100),10*np.random.randn(100),'o')
ax.set_title('Simple Scatter')

plt.show()

在这里插入图片描述

折线图

matplotlib.pyplot.plot(*args, **kwargs)
plot函数在官方文档的语法中只要求填入不定长参数,实际可以填入的主要参数主要如下:

在这里插入图片描述
color参数的8种常用颜色的缩写:
b:蓝色;g:绿色;r:红色;c:青色;m:品红;y:黄色;k:黑色;w:白色

分析特征内部数据分布与分散

绘制直方图

直方图可以发现分布表无法发现的数据模式、样本的频率分布和总体的分布。
matplotlib.pyplot.bar(left, height, width=0.8, bottom=None, hold=None, data=None, **kwargs)

常用参数及说明如下表:
在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(0)
mu,sigma=100,20
a=np.random.normal(mu,sigma,size=100)#均值方差给定的正态分布数组a

plt.hist(a,20,density=1,histtype='stepfilled',facecolor='b',alpha=0.75)
#第2个参数bin,代表直立方形的个数
#每个直方图包含多少元素就是直方图的高度,
#density=0纵轴就是元素的个数,density=1纵轴就是元素出现的概率
#alpha代表透明度
plt.title('Histogram')
plt.show()

在这里插入图片描述

绘制饼图

matplotlib.pylot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None,radius=None,…)
常用参数及说明如下表:
在这里插入图片描述
示例:

import matplotlib.pyplot as plt

labels='Frogs','Hogs','Dogs','Logs'
sizes=[15,30,45,10]
explode=(0,0.1,0,0)#突出30那一块,突出比例0.1

plt.pie(sizes,explode=explode,labels=labels,
        autopct='%1.1f%%',shadow=False,startangle=90)
#sizes饼图的尺寸,explode指出哪一块突出,labels给出每一块的标签,
#autopct显示百分数的方式,shadow带有阴影效果,startangle饼图的起始角度
plt.axis('equal')#正圆的饼图
plt.show()

在这里插入图片描述

绘制极坐标图

极坐标图在有关角度方面很有帮助。

示例如下:

import numpy as np
import matplotlib.pyplot as plt

N=20#极坐标图中数据的个数
theta=np.linspace(0.0,2*np.pi,N,endpoint=False)
radii=10*np.random.rand(N)
width=np.pi / 4*np.random.rand(N)

ax=plt.subplot(111,projection='polar')#面向对象绘图,当前绘制区域的对象是ax
bars=ax.bar(theta,radii,width=width,bottom=0.0)
#前3个参数分别为left绘图起始位置,height到圆心的高,width宽度

for r,bar in zip(radii,bars):
    bar.set_facecolor(plt.cm.viridis(r/10.))
    bar.set_alpha(0.5)
    
plt.show()

在这里插入图片描述

绘制箱线图

在这里插入图片描述
箱线图也称箱须图,其绘制需使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同特征时,更可表现其分散程度差异。
箱线图利用数据中的五个统计量(最小值、下四分位数、中位数、上四分位数和最大值)来描述数据,它可以粗略的看出数据是否具有对称性、分布的分散程度等信息,特别可以用于对几个样本的比较。

matplotlib.pyplot.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, meanline=None, labels=None,…)
常用参数及说明如下表:
在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值