Scatter方法
scatter(x,y,s=None,c=None,marker=None,cmap=None,edgecolors=None,…)
x,y:形如shape(n,),输入数据
s:size,标量或形如shape(n,),可选,默认:20
c:color,色彩或颜色序列,参数:b=blue,y=yellow,g=green,k=black…
marker:MarkerStyle可选,默认:‘o’圆形,其余有’.‘点,’,'像素,‘^’三角形等
cmap:颜色图谱(colormap),默认绘制为RGB(A)颜色空间。可选的有autumn:红-橙-黄,bone:黑-白,x线,cool:青,洋红,gray:黑-白,spring:洋红-黄,jet:蓝-青-黄-红
edgecolors:marker的边缘颜色
Make_blobs方法
make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
n_samples:生成的样本总数
n_features:每个样本的特征数
ceters:要生成的样本中心(类别)数
random_state:随机种子
Returns:
X:生成的样本数据集
y:生成的样本标签
例子
from sklearn.datasets import make_blobs
#导入KNN分类器
from sklearn.neighbors import KNeighborsClassifier
#导入画图工具
import matplotlib.pyplot as plt
#导入数据集拆分工具
from sklearn.model_selection import train_test_split
#生成样本数为200,分类为2的数据集
data = make_blobs(n_samples=200,centers=2,random_state=8)
X,y = data
#将生成的数据集进行可视化
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()
运行结果: