本文介绍如何利用plt.pcolormesh来绘制以下分类图
plt.pcolormesh能够直观的表现出分类的边界,而只用散点图无法显示出分类的边界线,如下图所示:
下面以make_moons数据集为例,用神经网络说明 plt.pcolormesh()的用法
引入所需库:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import make_moons
from sklearn.model_selection import train_test_split #划分训练集和测试集
构建样本:
#产生样本并将样本分成训练样本与测试样本
x,y=make_moons(100,noise=0.2)
x_train,x_test,y_train,y_test=train_test_split(x, y, test_size=0.4)
构建神经网络:
#构建神经网络
model = MLPClassifier(solver='lbfgs',alpha=1e-5,hidden_layer_sizes=(6,3))
model.fit(x_train,y_train) #权重方法 lbfgs:quasi-Newton 方法(针对小数据集较好);
#hidden_layer_sizes=(6, 3)表示有两层隐藏层,第一层隐藏层有6个神经元,第二层有3个神经元。
显示结果:
cm_bg = mpl.colors.ListedColormap(['r', 'y']) #背景颜色(样本分为2个类,所以为两个颜色)
plt.pcolormesh(xx, yy, y_predict.reshape(xx.shape), cmap=cm_bg) #绘制网格背景
#plt.pcolormesh()会根据y_predict的结果自动的在cmap中选择颜色
绘制出网格背景为:
然后再把绘制出的散点分布上去:
cm_pt = mpl.colors.ListedColormap(['w', 'k']) #样本点颜色(样本分为2个类,所以为两个颜色)
plt.scatter(x_train[:,0],x_train[:,1],c=y_train,cmap=cm_pt,marker='o') #绘制样本点
#plt.scatter()会根据y_train的结果自动的在cmap中选择颜色,c参数代表颜色
#显示结果
x_min,x_max=x_train[:,0].min(),x_train[:,0].max()
y_min,y_max=x_train[:,1].min(),x_train[:,1].max()
xx,yy=np.meshgrid(np.linspace(x_min, x_max, 200),np.linspace(y_min, y_max, 200)) #生成网格采样点
#np.linspace(x_min, x_max, 200)在[x_min,x_max]中产生200个均匀间隔的数字(包括尾部)
grid_test=np.stack((xx.flat, yy.flat), axis=1) #测试点 (xx.flat降维)
y_predict=model.predict(grid_test)
cm_pt = mpl.colors.ListedColormap(['w', 'k']) #样本点颜色(样本分为2个类,所以为两个颜色)
cm_bg = mpl.colors.ListedColormap(['r', 'y']) #背景颜色(样本分为2个类,所以为两个颜色)
plt.xlim(x_min, x_max);plt.ylim(y_min, y_max) #设置坐标范围
plt.pcolormesh(xx, yy, y_predict.reshape(xx.shape), cmap=cm_bg) #绘制网格背景
#plt.pcolormesh()会根据y_predict的结果自动的在cmap中选择颜色
plt.scatter(x_train[:,0],x_train[:,1],c=y_train,cmap=cm_pt,marker='o') #绘制样本点
#plt.scatter()会根据y_train的结果自动的在cmap中选择颜色,c参数代表颜色
plt.grid(True);plt.show()
#显示网格
print('计算预测精度',model.score(x_test,y_test))