kmeans聚类是一个高效的非监督聚类方法,我们先来看看基本原理是什么。
1.如果给一堆点进行二分类问题,在已有数据中随机抽取两个点或者随机新建两个点,分别记为A、B类重心。
2.计算每一个点到这两个点的距离,将其标记为距离A、B中心较近的那一类,给所有点完成分类。
3.计算A类点和B类点的新重心。
4.重复2、3步骤,再次给所有点进行分类,分类后更新重心点。直到满足迭代停止条件。
迭代停止条件可能会设置一定迭代次数,也可能设置点到各自重心距离和小于某个阈值。
既然能进行分类,那么对于图像分割也是可以的,只是对于每一个图像点,我们采用的特征是R、G、B三通道的值来进行空间聚类,下面来看看怎么用。
import cv2
import numpy as np
img = cv2.imread('1.png')
img_flat = img.reshape((img.shape[0] * img.shape[1], 3))
img_flat = np.float32(img_flat)
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TermCriteria_MAX_ITER, 20, 0.5)
flags = cv2.KMEANS_RANDOM_CENTERS
compactness, labels, centers = cv2.kmeans(img_flat, 2, None, criteria, 10, flags)
labels=1-labels
img_output = labels.reshape((img.shape[0], img.shape[1]))
img_output=np.uint8(img_output*255)
cv2.imshow('1.png',img_output)
图片原图及分割效果: