直方图:
直方图又称质量分布图,是由一系列高低不等的纵向矩形条或线段组成的图表,用于反映数据的分布和波动情况。
使用pyplot的hist()函数可以快速绘制直方图,hist()函数的语法格式如下所示:
hist(x,bins=None,range=None,density=None,weights=None,cumulative=False,bottom=None,
histtype='bar',align='mid',orientation='vertical',rwidth=None,log=False,
label=None,stracked=False,normed=None,*,color=None,data=None,**kwargs)
该函数常用参数的含义如下:
- x:表示x轴的数据,可以为单个数组或多个数组的序列。
- bins:表示矩形条的个数,默认为 10。
- range:表示数据的范围。若没有提供 range 参数的值,则数据范围为(x.min(),x.max())。cumulative:表示是否计算累计频数或频率。
- align:表示矩形条边界的对齐方式。可设为"left'、'mid'或'right',默认为 'mid'。'
- orientation:表示矩形条的摆放方式,默认为'vertical,即垂直方向。
- rwidth :表示矩形条宽度的百分比,默认为0。若 histtype的值为'step'或'stepfilled,则
- 直接忽略 rwidth 参数的值。
- stacked:表示是否将多个矩形条以堆积形式摆放.
使用面向对象API方法绘制直方图:
实例:在生成10000个随机数前提下,另外再生成一个包含20000个数据的标准正态分布数组,并在同一个绘图区域并排展示。
代码如下:
#导入模块
import matplotlib.pyplot as plt
import numpy as np
# 1.生成10000个随机数
random_state1 = np.random.RandomState(19680801)
random_x1 = random_state1.randn(10000)
# 2.生成20000个随机数
random_state2 = np.random.RandomState(19680801)
random_x2 = random_state1.randn(10000)
#创建画布并添加绘画区域:
fig = plt.figure( )
ax = fig.add_subplot(111)
# 3.绘制包含25个矩形条的两组直方图(并排展示)
ax.hist([random_x1,random_x2],bins=25,histtype="bar")
# 4.展示图表
plt.show()
运行程序,效果如下:
饼图或圆环图:
饼图是由若干个面积大小不一,以条形或颜色填充的扇形组成的圆形图表,他使用圆表示数据的总量,组成圆的每个扇形表示数据中各项占总量的比例大小,主要用于显示数据中各项大小与各项总和的比例。
圆环图使用圆环表示整体,组成圆环的每个楔形表示各项的占比。与饼图相比,圆环图可以展示多组数据的比例。
使用pyplot的pie()函数可以快速绘制饼图或圆环图,pie()函数的语法格式如下所示:
pie(x, explode=None, labels=None, autopct=None, pctdistance=0.6, shadow=False,
labeldistance=1.1, startangle=None, radius=None, counterclock=True,
wedgeprops=None, textprops=None, center=(0,0), frame=False, rotatelabels=False,
*, data=None)
该函数常用参数的含义如下:
- x:表示扇形或楔形的数据.
- explode:表示扇形或楔形离开圆心的距离。
- labels:表示扇形或楔形对应的标签文本。
- autopct:表示控制扇形或楔形的数值显示的字符串,可通过格式字符串指定小数点后
- 的位数。
- pctdistance:表示扇形或楔形对应的数值标签距离圆心的比例,默认为 0.6。
- shadow:表示是否显示阴影
- abeldistance:表示标签文本的绘制位置(相对于半径的比例),默认为 1.1。
- startangle:表示起始绘制角度,默认从x轴的正方向逆时针绘制。
- radius:表示扇形或楔形的半径。
- wedgeprops:表示控制扇形或楔形属性的字典。例如,通过wedgeprops={'width':0.7}将楔形的宽度设为 0.7。
- textprops:表示控制图表中文本属性的字典。
- center:表示图表的中心点位置,默认为(0,0 )。
- frame:表示是否显示图框。
使用面向对象API方法绘制饼图或圆环图:
实例:将各分类对应的金额与总支出金额的比例作为饼图的数据,使用pie()函数绘制支付宝月账单报告的饼图和圆环图。
- # 需求一: 改用圆环图展示数据
- # 需求二: 圆环图中的数值标签(即百分数)需精确到小数点后1位,且其必须位于楔形中间位置
- # 需求三: 圆环图中"购物"楔形绘制到左下角
圆环图代码如下:
#导入模块
import matplotlib.pyplot as plt
import matplotlib as mpl
# 设置中文
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False
# 外侧说明文字
kinds = ['购物', '人情往来', '餐饮美食', '通信物流', '生活日用', '交通出行',
'休闲娱乐', '其他']
# 原有数据
money_scale = [800, 100, 1000, 200, 300, 200, 200, 200]
# 爆炸程度
dev_position = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
#创建画布并添加绘画区域:
fig = plt.figure( ) #创建代表画布的Figure类的对象fig
ax = fig.add_subplot(111) #在画布fig上添加坐标系风格的绘画区域ax
# 绘制饼图,设置饼图属性
ax.pie(money_scale, radius=1.5, wedgeprops={'width':0.7},
pctdistance=3/4, labels=kinds, autopct='%.1f%%',
shadow=True, explode=dev_position, startangle=180)
#展示图表
plt.show()
运行程序,效果如下:
散点图或气泡图:
散点图又称X-Y图,是由若干个数据点组成的图表,主要用于判断两变量之间是否存在某种关联,或者总结数据点的分布模式。
气泡图是散点图的变形,它是一种能够展示多变量关系的图表,适用于分类数据对比、多变量相关性等情况,常见于财务数据分析中。
使用pyplot的scatter()函数可以快速绘制散点图或气泡图,scatter()函数的语法格式如下所示:
sactter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None,
vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *,
plotnofinite=False,data=None,**kwargs)
该函数常用参数的含义如下:
- x,y:表示数据点的位置。
- s:表示数据点的大小。
- c:表示数据点的颜色。
- marker:表示数据点的样式,默认为圆形。
- cmap:表示数据点的颜色映射表,仅当参数c为浮点数组时才使用。
- norm:表示数据亮度,可以取值为0~ 1。
- vmin,vmax:表示亮度的最小值和最大值。若传入了norm 参数,则忽略 vmin 和 vmax 参数。
- alpha:表示透明度,可以取值为0~1。(越小越透明) linewidths:表示数据点边缘的宽度。
- edgecolors:表示数据点边缘的颜色。
使用面向对象API方法绘制散点图或气泡图:
实例:使用scatter()函数将汽车速度与制动距离的散点图绘制成气泡图,并且气泡从左到右越来越大。
- # 需求一: 将散点图绘制成气泡图,气泡从左到右越来越大
- # 需求二: 将所有气泡设置为橙色
代码如下:
#导入模块
import numpy as np
import matplotlib.pyplot as plt
#显示中文
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
# 准备 x 轴和 y 轴的数据
x_speed = np.arange(10, 210, 10)
y_distance = np.array([0.5, 2.0, 4.4, 7.9, 12.3,
17.7, 24.1, 31.5, 39.9, 49.2,
59.5, 70.8, 83.1, 96.4, 110.7,
126.0, 142.2, 159.4, 177.6, 196.8])
# 绘制气泡图
area=np.linspace(20,300,20) #生成一个等距递增数列
#创建画布并添加绘画区域:
fig = plt.figure( ) #创建代表画布的Figure类的对象fig
ax = fig.add_subplot(111) #在画布fig上添加坐标系风格的绘画区域ax
#绘制图表
ax.scatter(x_speed,y_distance,s=area,c='orange')
# 展示图表
plt.show()
运行程序,效果如下:
误差棒图:
误差棒图是使用误差棒注明被测量数据的不确定度大小的图表,用于测量数据中客观存在的测量偏差(标准差或标准误差)。误差棒图中误差棒是以被测量数据的平均值为中点,在表示测量值大小的方向上画出的一条线段,线段长度的一半为不确定度。
使用pyplot的errorbar()函数可以快速绘制误差棒图,errorbar()函数的语法格式如下所示:
errorbar(x, y, yerr=None, xerr=None, fmt=' ', ecolor=None, elinewidth=None,
capsize, barsabove=False, lolims=False, uplims=False, xlolims=False,
xuplims=False, errorevery=l, capthick=None, *, data=None, **kwargs)
该函数常用参数的含义如下。
- x,y:表示数据点的位置。
- xerr,yerr:表示数据的误差范围。
- fint:表示数据点的标记样式和数据点之间连接线的样式。ecolor:表示误差棒的线条颜色。
- elinewidth:表示误差棒的线条宽度。
- capsize:表示误差棒边界横杆的大小。
- capthick:表示误差棒边界横杆的厚度。
使用面向对象API方法绘制误差棒图:
实例:绘制马尾松、樟树、杉木、桂花的不同季节的细根生物量的误差棒图。
代码如下:
#导入模块
import numpy as np
import matplotlib.pyplot as plt
#显示中文
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False
#准备x轴和y轴的数据
x=np.arange(3)
y1=np.array([2.04, 1.57, 1.63])
y2=np.array([1.69,1.61,1.64])
y3=np.array([4.65,4.99,4.94])
y4=np.array([3.39,2.33,4.10])
# 指定测量偏差
error1 = [0.16, 0.08, 0.10]
error2 = [0.27, 0.14, 0.14]
error3 = [0.34, 0.32, 0.29]
error4 = [0.23, 0.23, 0.39]
#宽度为0.2
bar_width =0.2
#绘制柱形图,设置柱形的宽度、对齐方式、标签
plt.bar(x, y1, bar_width)
plt.bar(x + bar_width, y2, bar_width, align="center",
tick_label=["春季","夏季","秋季"])
plt.bar(x + 2*bar_width, y3, bar_width)
plt.bar(x + 3*bar_width, y4, bar_width)
#绘制误差棒 ; 横杆大小为 3,线条宽度为 3,线条颜色为黑色,数据点标记为像素点
plt.errorbar(x, y1,yerr=error1,capsize=3, elinewidth=2,fmt='k,')
plt.errorbar(x + bar_width,y2, yerr=error2, capsize=3,elinewidth=2, fmt='k,')
plt.errorbar(x + 2*bar_width,y3,yerr=error3,capsize=3,elinewidth=2, fmt='k,')
plt.errorbar(x + 3*bar_width, y4, yerr=error4,capsize=3,elinewidth=2, fmt='k,')
plt.show() #展示图表
运行程序,效果如下: