原型聚类(prototype-based clustering)
原型聚类,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用,通常情形下,算法先对原型进行初始化,然后对原型进行迭代更新求解,采用不同的原型表示,不同的求解方式,将产生不同的算法,主要有:K均值算法、学习向量量化和高斯混合聚类。
K均值算法
K均值算法,顾名思义,可知将一组数据 D={ x1,x2,...,xm} D = { x 1 , x 2 , . . . , x m } 聚成K类,”均值”是指对聚类所得簇划分 C={ C1,C2,...,Ck} C = { C 1 , C 2 , . . . , C k } 最小化平方误差
E=∑i=1k∑x∈Ci∥x−μi∥22(1.1) (1.1) E = ∑ i = 1 k ∑ x ∈ C i ‖ x − μ i ‖ 2 2
其中 μi=