Chapter13 数据可视化
python中数据可视化库matplotlib,首先导入此库
import matplotlib.pyplot as plt
# 产生随机数作为横纵坐标
x = np.arange(6)
y = np.arange(6)
1.建立坐标系。
- add_subplot(R,C,N ):建立R * C个坐标系,在第N个坐标系上绘图。用此方法必须先建立画布
# 方法一
# 建立画布。figsize设置画布的宽和高
fig = plt.figure(figsize=(20,5))
# fig.add_subplot(1,1,1) #建立一个坐标系
fig.add_subplot(2,2,1) #建立4个坐标系
fig.add_subplot(2,2,2)
fig.add_subplot(2,2,3)
plt.plot(x,y)
plt.bar(x,y)
fig.add_subplot(2,2,4)
plt.show()
效果如下:
- plt.subplot2grid((R*C),(x,y)):建立R * C个坐标系,在第(x,y)个坐标系上绘图。此方法不用建立画布,导入plt库即可。将绘图代码跟在建立坐标系语句后
# 建立坐标系-方法二
x = np.arange(6)
y = np.arange(6)
plt.subplot2grid((2,2),(0,0))
plt.plot(x,y)
plt.subplot2grid((2,2),(1,1))
plt.bar(x,y)
plt.show()
效果如下:
- plt.subplot(R,C,N):建立R * C个坐标系,在第N个坐标系上绘图。此方法与plt.subplot2grid类似,也需要将绘图代码跟在建立坐标系语句后
# 建立坐标系-方法3:
plt.subplot(2,2,2)
plt.plot(x,y)
plt.subplot(2,2,3)
plt.bar(x,y)
plt.show()
- plt.subplots(R,C,N):也是plt库的一个函数,它与subplot2grid函数和subplot函数的不同之处是,subplot2grid函数和subplot函数每次只返回一个坐标系,而subplots函数一次可以返回多个坐标系。subplots的返回值是(fig,ax)元组,fig是Figure实例,ax是axis对象,分别表示分区和子区域。
# 建立坐标系-方法4:
fig,ax = plt.subplots(2,2)
ax[0,0].bar(x,y)
ax[0,1].plot(x,y)
ax[1,0].hist(x,y)
ax[1,1].scatter(x,y)
plt.show()
总结:第一种创建坐标系的方法 add_subplot 属于对象式编程,所有的操作都是针对某个对象进行的,比如先建立一块画布,然后在这块画布上建立坐标系,进而在坐标系上绘图。而后三种建立坐标系的方法属于函数式编程,都是直接调用 plt 库里面的某个函数或者方法达到创建坐标系的目的。
2.设置坐标轴。
- 设置标题。xlabel,ylable
- 设置刻度,默认都是x,y轴的值,可自定义。plt.xticks(ticks,lables),ticks是刻度值,lables是刻度值标签。
- 设置坐标轴范围。xlim,ylim
- 坐标轴显示设置。plt.axis(‘off’),不显示坐标轴。
plt.subplot(2,2,2)
plt.plot(x,y)
plt.xlabel('横坐标',fontsize = '10',color = 'red')
plt.ylabel('纵坐标')
plt.xlim(0,10)
plt.ylim(0,6)
plt.subplot(2,2,3)
plt.bar(x,y)
plt.xticks(np.arange(6),['一','二','三','四','五','六'])
plt.yticks(np.arange(6),['一','二','三','四','五','六'])
plt.subplot(2,2,4)
plt.bar(x,y)
plt.axis('off')
plt.show()
效果如下:
3.其他格式设置。
- grid():打开网格,默认横纵网格都打开,可通过axis='x’或axis='y’只打开某个轴的网格线
- legend():设置图例
- title():设置标题
- text():设置数据标签。 plt.text(x,y,str,ha,va,fontsize)。对整个图标是显示数据标签用循环
fig = plt.figure(figsize=(10,5))
fig.add_subplot(1,1,1) #建立一个坐标系
plt.plot(x,y,label = '折线图',color = 'orange')
plt.bar(x,y,label = '柱状图')
# 打开网格
plt.grid(linestyle = 'dashed',linewidth =1)
# 设置图例
plt.legend()
# 设置标题
plt.title('matplotlib可视化基础')
# 设置数据标签
for a,b in zip(x,y):
plt.text(a,b,b,ha = 'center',va = 'bottom',fontsize = 15,color = 'red')
效果如下:
3.常用图表绘制
调用plt库的bar(),plot(),barh(),scatter(),pie()等方法绘制柱状图、折线图、条形图、散点图、饼图等常用图表。个人接触过Tableau可视化工具,感觉可视化功能十分强大,matplotlib功能也很强大,但个人感觉没有Tableau更直观。