快乐虾
欢迎转载,但请保留作者信息
K均值是一个经典的聚类算法,我们试试在python下使用它。
首先以(-1.5, -1.5)和(1.5, 1.5)为中心点各生成10个点的随机坐标值,我们希望用K均值算法将它们正确的分类。
# 创建測试的数据点。2类
# 以(-1.5, -1.5)为中心
rand1 = np.ones((10,2)) * (-2) + np.random.rand(10, 2)
print(rand1)
# 以(1.5, 1.5)为中心
rand2 = np.ones((10,2)) + np.random.rand(10, 2)
print(rand2)
# 合并随机点
data = np.vstack((rand1, rand2))
接下来kmeans出场。
这个函数的python原型为:
In [14]: help(cv2.kmeans)
Help on built-in function kmeans:
kmeans(...)
kmeans(data, K,bestLabels, criteria, attempts, flags[, centers]) -> retval, bestLabels,centers
在我们的脚本中调用它:
# kmeans
(ret, label, center) = cv2.kmeans(data, 2, None, (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_MAX_ITER, 10, 0.1), 10, cv2.KMEANS_RANDOM_CENTERS )
通过此函数我们得到了2个类别的中心点和每一个点所属的类别。
最后按分类显示:
# 按label进行分类显示
idx = np.hstack((label, label))
for i in range(0, 2) :
type_data = data[idx == i]
type_data = np.reshape(type_data, (type_data.shape[0] / 2, 2))
plt.plot(type_data[:,0], type_data[:,1], 'o')
plt.show()
非常好的一个结果: