1.K最近邻算法
from sklearn.datasets import make_blobs
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import numpy as np
data = make_blobs(n_samples=200, centers =2,random_state=8)
X, y = data
#print(X) #点(,)
#print(y) #分类
#plt.scatter(X[:,0], X[:,1], c=y, cmap=plt.cm.spring, edgecolor='k')
#plt.show()
clf = KNeighborsClassifier()
clf.fit(X,y)
#下面的代码用于画图
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
#print(np.arange(x_min, x_max, .02)) #最大最小之间隔0.02
# xx 为横坐标乘以纵坐标维数,yy为纵坐标乘以横坐标维数
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02),
np.arange(y_min, y_max, .02))
#这段代码中ravel函数将多维数组降为一维,仍返回array数组,元素以列排列。之后调用np.c_[]将xx.ravel()得到的列后增加以列yy.ravel()。
# 这时每行元素变为了[[x1,y1];
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
#print(xx.ravel())
#shape是查看数据有多少行多少列
#reshape()是数组array中的方法,作用是将数据重新组织
print(Z)
Z = Z.reshape(xx.shape)
#print(xx.shape)
print(Z)
#背景图
plt.pcolormesh(xx, yy, Z, cmap=plt.cm.Pastel1)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.spring, edgecolor='k')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier:KNN")
plt.scatter(6.75,4.82, marker='*',c='red', s=200)
plt.show()