可视化 – Matplotlib学习入门
- 学习目标
- 为什么学习Matplotlib
- 基础绘图功能 --折线图为例
- 常见图像绘制
1 为什么学习Matplotlib
可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。
- 能将数据进行可视化,更直观的呈现
- 使数据更加客观、更具说服力
2 基础绘图功能
2.1 实现一个简单的Matplotlib画图 – 以折线图为例
2.1.1 matplotlib.pyplot模块调用
matplotlib.pytplot包含了一系列类似于matlab的画图函数
import matplotlib.pyplot as plt
2.1.2 图形绘制流程
- 创建画布 – plt.figure()
plt.figure(figsize=(), dpi=)
#figsize:指定图的长宽
#dpi:图像的清晰度
#返回fig对象
- 绘制图形 --plt.plot(x, y)
以折线图为例
- 显示图像 – plt.show()
2.1.3 折线图绘制与显示
举例:展现上海一周的天气,比如从星期一到星期日的天气温度如下
import matplotlib.pyplot as plt
# 1.创建画布
plt.figure(figsize=(7,7), dpi=100)
# 2.绘制折线图import matplotlib.pyp
plt.plot([1,2,3,4,5,6,7], [17,17,18,15,11,11,13])
# 3.显示图像
plt.show()
2.2 完善原始折线图 — 给图形添加辅助功能
为了更好地理解所有基础绘图功能,我们通过天气温度变化的绘图来融合所有的基础API使用
需求:画出某城市11点到12点1小时内每分钟的温度变化折线图,温度范围在15度~18度
2.2.1 准备数据并画出初始折线图
import matplotlib.pyplot as plt
import random
# 画出温度变化图
# 0. 准备数据
x = range(60) #每分钟的刻度
y = [random.uniform(15,18) for i in x] #生成某城市的温度数据
# 1. 创建画布
plt.figure(figsize=(20,8), dpi=100)
# 2. 绘制折线图
plt.plot(x,y)
# 3. 显示图像
plt.show()
2.2.2 添加自定义x,y刻度
- plt.xticks(x, **kwargs)
x:要显示的刻度值 - plt.yticks(y, **kwargs)
y:要显示的刻度值
import matplotlib.pyplot as plt
import random
# 画出温度变化图
# 0. 准备数据
x = range(60) #每分钟的刻度
y = [random.uniform(15,18) for i in x] #生成某城市的温度数据
# 1. 创建画布
plt.figure(figsize=(20,8), dpi=100)
# 2. 绘制折线图
plt.plot(x,y)
# 增加以下两行代码
# 构造x轴刻度标签
x_ticks_label = ["11点{}分".format(i) for i in x]
# 构造y轴刻度
y_ticks = range(40)
# 修改x,y轴坐标的刻度显示
plt.xticks(x[::5], x_ticks_label[::5])
plt.yticks(y_ticks[::5])
# 3. 显示图像
plt.show()
2.2.3 中文显示问题解决
在Python脚本中动态设置matplotlibrc,这样也可以避免由于更改配置文件而造成的麻烦,具体代码如下:
from pylab import mpl
# 设置显示中文字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
有时候,字体更改后,会导致坐标轴中的部分字符无法正常显示,此时需要更改axes.unicode_minus参数:
# 设置正常显示符号
mpl.rcParams["axes.unicode_minus"] = False
import matplotlib.pyplot as plt
import random
# 画出温度变化图
# 0. 准备数据
x = range(60) #每分钟的刻度
y = [random.uniform(15,18) for i in x] #生成某城市的温度数据
# 1. 创建画布
plt.figure(figsize=(20,8), dpi=100)
# 2. 绘制折线图
plt.plot(x,y)
# 增加以下两行代码
# 构造x轴刻度标签
x_ticks_label = ["11点{}分".format(i) for i