0 简单介绍
数据可视化是指直观展现数据,是数据处理过程的一部分
常见的库和各自特点
- Matplotlib (功能强大,代码相对复杂)
- 在执行各种任务方面非常高效,可以将可视化文件导出为所有常见格式(PDF, SVG, JPG, PNG, BMP和GIF)
- 可以创建流行的可视化类型—折线图、散点图、直方图、条形图、误差图、饼图、箱型图以及更多其他类型的图,还支持3D绘图
- Pandas (使用简单,功能稍弱)
- 基于 matplotlib ,是对matplotlib的二次封装
- series和dataframe都有plot()方法来绘图
- Seaborn(代码简单,效果不错)
- 基于 matplotlib ,进行了更高级的封装,作图更容易
- echarts 和 pyecharts(追求可视化效果)
- echarts可以流畅的运行在PC和移动设备上,兼容当前绝大多数浏览器,底层以来矢量图形库ZRender,提供直观,交互丰富,可高度个性化定制的数据可视化图表
- pyecharts是用Python生成echarts图表的类库
1 Matplotlib数据可视化
1.1 Matplotlib 两套基本绘图API介绍
matplotlib提供两种方法来作图:状态接口(通过plt调用函数)和面向对象(创建坐标系后使用坐标系属性)
数据准备
import matplotlib.pyplot as plt
x = [-3,5,7]
y = [10,2,5]
- 状态接口 plt 画图
plt.figure(figsize=(15,3)) #创建一个画布
plt.plot(x,y)
plt.xlim(0,10) # 设置坐标轴显示的范围
plt.ylim(-3,8)
plt.xlabel('X Axis') # x轴 名字
plt.ylabel('Y Axis',size=20) # Y轴 名字
plt.title('Line Plot',size=30) # 整个图表的名字
plt.grid(True) # 网格线
plt.show()
- 面向对象 plt 画图创建坐标系, 调用坐标系的设置属性的方法, 来绘图
plt.show()
#%%
fig,ax = plt.subplots(figsize=(15,3)) # fig画布 ax 坐标系
ax.plot(x,y) # 调用坐标系的方法
ax.set_xlim(0,10)
ax.set_ylim(-3,8)
ax.set_xlabel('x axis')
ax.set_ylabel('y axis',size = 20)
ax.set_title('Line Plot', size = 30)
plt.show()
- 设置子图区域
fig = plt.figure(figsize=(20,8))
# 绘图区域可以分成几行 几列 当前图绘制在第几个位置上 位置从1开始计数的
# fig.add_subplot(1,1,1)
fig.<