1.k-means算法
第一步:随机选择k个样本作为k个聚类的中心,计算每个样本到各个聚类中心的欧氏距离,将该样本分配到与之距离最近的聚类中心所在的类别中。
第二步:根据第一步所得到的聚类划分,分别计算每个聚类的几何中心,将几何中心作为新的聚类中心,重复第一步,直到计算所得几何中心与聚类中心重合或接近重合为止。
# 加载multiple3.txt,基于K均值算法完成样本的聚类
import numpy as np
import sklearn.cluster as sc
import matplotlib.pyplot as mp
data = np.loadtxt('../data/ml_data/multiple3.txt', delimiter=',')
print(data)
# k-means聚类
model = sc.KMeans(n_clusters=4)
model.fit(data)
# 聚类中心
centers = model.cluster_centers_
print(centers)
l, r = data[:, 0].min()-1, data[:, 0].max()+1
b, t = data[:, 1].min()-1, data[:, 1].max()+1
grid_x, grid_y = np.meshgrid(np.linspace(l, r, 500), np.linspace(b, t, 500))
samples = np.column_stack((grid_x.ravel(), grid_y.ravel()))
grid_z = model.predict(samples)
grid_z.shape = grid_x.shape
pred_test_y = model.predict(data)
mp.title('k-means')
mp.pcolormesh(grid_x, grid_y, grid_z, cmap='gray')
mp.scatter(data[:, 0], data[:, 1], c=pred_test_y, cmap='brg', s=80)
mp.scatter(centers[:, 0], centers[:, 1], marker='+', cmap='gold')
mp.show()
2.图像量化
import