在机器学习中,可视化是数据特征分析和结果展示的一个重要手段。它可以提供数据的分布特征、统计特征,回归、分类和聚类等的结果。
目标: 将数据以图标的方式展示,从而分析出数据有价值的规律
绘图工具:(此处主要学习Matplotlib部分)
- Matplotlib(功能多)
- Seaborn库(基于Matplotlib绘制更多图表;擅长统计图和pandas更好结合)
- Pyecharts库(擅长地理图表的绘制)
绘图的一般流程:
一、Matplotlib可视化
1、折线图(趋势) plot
折线图是用直线段将各数据点连接起来而组成的图形,以折线的方式显示数据的变化趋势。
# 导入 Numpy 模块
# 导入 matplotlib.pyplot 库
import numpy as np
import matplotlib.pyplot as plt
# 准备数据
x=np.linspace(0,10,30) # 0-10之间30个元素的等差数列
noise=np.random.randn(30) # 30个标准正态分布的元素
y1=x**2+2*noise # 数据1
y2=x**1+2*noise # 数据2
y3=x**1.5+2*noise # 数据3
plt.rcParams['font.sans-serif']='SimHei' # 设置字体为SimHei以显示中文
plt.rc('font',size=15) # 设置图中字号大小
plt.figure(figsize=(6,4)) # 设置画布
# 绘制折线图,设置颜色和线型:b蓝色 g绿色 r红色 y黄色 w白色 c青色 m紫色
plt.plot(x,y1,color='r',linestyle='--')
plt.plot(x,y2,color='b',linestyle='-')
plt.plot(x,y3,color='g',linestyle='-.')
plt.title('折线图') # 添加标题 title
plt.legend(['曲线y1','曲线y2','曲线y3']) # 添加图例 legend
plt.xlabel('x') # 添加横轴标签 xlabel
plt.ylabel('y') # 添加纵轴标签 ylabel
plt.show() # 显示图片
点线图:
# 绘制点线图
plt.figure(figsize=(6,4)) # 设置画布大小
# 绘制点线图,设置颜色、线型、点的形状
plt.plot(x,y1,color='r',linestyle='--',marker='o')
plt.plot(x,y2,color='b',linestyle='-',marker='*')
plt.plot(x,y3,color='g',linestyle='-.',marker='^')
plt.title('点线图') # 添加标题
plt.legend(['曲线 y1','曲线 y2','曲线 y3']) # 添加图例 legend
plt.ylabel('x') # 添加横轴标签
plt.ylabel('y') # 添加纵轴标签
plt.show() # 显示图片
2、柱状图 bar
柱状图又称长条图、柱状统计图,是一种以长方形的长度为变量的统计图表。
# 绘制柱状图
plt.figure(figsize=(6,4)) # 设置画布
plt.bar(x,y1,width=0.2) # 绘制柱状图:x=x轴数据,height=条形高度 width=宽默认0.8
plt.title('柱状图') # 添加标题
plt.xlabel('x') # 添加横轴标签
plt.ylabel('y1