聚类是机器学习中很重要的一部分,是一种无监督学习,本次选择K-means算法对图片的像素进行聚类
K-means,顾名思义,K-均值,首先随机地选择k个对象,每个对象初始地代表了一个簇的平均值或中心。对剩余的每个对象根据其与各个簇中心的距离,将它赋给最近的簇,然后重新计算每个簇的平均值。这个过程不断重复,直到每个簇的中心确定不变。
首先关注一下空间中每个点如何计算,普遍采用欧式距离,对于空间中两个点来说便是计算两个向量的欧式距离:
通过每次计算每个点与中心点的距离,来确定每次K个类的中心,然后不断迭代直到K个中心不再变化为止。
算法的优缺点还是比较多的,主要算法太经典太了,想知道更具体的请看Wiki上的解释把。
接下来是实验部分了,实验主要对图片的像素聚类:
对一张图片的像素点进行聚类,每个像素点是一个五维样本(x,y,r,g,b)进行聚类,其中x,y代表像素的位置,r,g,b分别代表个每个像素的图像特征RGB值。
算法步骤:
1随机初始K个初始点作为聚类中心