绘制折线图 plot()
参数说明:
mfc:标记的颜色。
ms:标记的大小。
mec:标记边框的颜色。
alpha:透明度,设置该参数可以改变颜色的深浅。
举例:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df=pd.read_excel('体温.xls')
plt.rcParams['font.sans-serif']=['SimHei']
x=df['日期']
y=df['体温']
plt.figure(figsize=(10,8),facecolor='c')
plt.plot(x,y,color='m',linestyle='-',marker='o',mfc='w')
plt.xlabel('2020年2月')
plt.ylabel('基础体温')
# 设置xy轴的最大限度
# plt.xlim(1,14)
# plt.ylim(36.0,36.5)
# 网格线
plt.grid(linestyle='--')
for a,b in zip(x,y):
plt.text(a,b+0.03,'%.1f'%b,ha='center',va='bottom',fontsize=9)
# 标题
plt.title('14天基础体温表',fontsize='18')
# 图标图例
plt.legend(('基础体温',))
# 标注最高温
x_max=x[y.idxmax()]
y_max=y[x.idxmax()]
plt.annotate('最高体温',xy=(x_max,y_max),xytext=(x_max+0.3,y_max))
# 坐标轴刻度线
plt.rcParams['xtick.direction'] = 'in'
效果
绘制柱形图
参数说明:
x:x轴数据。
height:柱子的高度,也就是y轴数据。
width:浮点型,柱子的宽度,默认值为0.8,可以指定固定值。
bottom:标量或数组,可选参数,柱形图的y坐标,默认值为None。
*:星号本身不是参数。星号表示其后面的参数为命名关键字参数,命名关键字参数必须传入参数名;否则程序会出现错误。
align:对齐方式,如center(居中)和edge(边缘),默认值为center。
data:data关键字参数。如果给定一个数据参数,所有位置和关键字参数将被替换。
kwargs:关键字参数,其他可选参数,如color(颜色)、alpha(透明度)、label(每个柱子显示的标签
多柱形图
柱形图中若显示n个柱子,则柱子宽度值需小于1/n;否则柱子会出现重叠现象。
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel('books.xlsx',sheet_name='Sheet2')
plt.rcParams['font.sans-serif']=['SimHei']
labels=df['年份']
y1=df['京东']
y2=df['天猫']
y3=df['自营']
width=0.25
x=[i for i in range(len(labels.values))]
x=pd.Series(x)
plt.bar(x,y1,width=width,color='b',alpha=0.7)
plt.bar(x+width,y2,width=width,color='y')
plt.bar(x+2*width,y3,width=width,color='g')
plt.xticks(x,labels)
plt.xlabel('年份')
plt.ylabel('销量')
plt.ylabel('线上销售额(元)')
plt.title('2013-2019年线上图书销售额分析图')
plt.grid(linestyle=':')
绘制直方图 hist()
参数说明:
x:数据集,最终的直方图将对数据集进行统计。
bins:统计数据的区间分布。
range:元组类型,显示的区间。
density:布尔型,显示频率统计结果,默认值为None。设置值为False,不显示频率统计结果;设置值为True,则显示频率统计结果。需要注意,频率统计结果=区间数目/(总数×区间宽度)。
histtype:可选参数,设置值为bar、barstacked、step或stepfilled,默认值为bar,推荐使用默认配置,其中step使用的是梯状,stepfilled则会对梯状内部进行填充,效果与b