1.原型聚类
原型聚类算法假设聚类结构可以通过一组原型刻画,通常算法先会对原型进行初始化,然后对原型进行迭代更新求解。不同的原型表示和不同的求解方式会产生不同的算法。
下面主要介绍三种典型的原型聚类算法:k 均值、学习向量量化 和 高斯混合聚类。
1.1K-均值
1.2学习向量量化
与 k 均值算法不同,学习向量量化(LVQ)的学习过程中会利用样本的类别信息,所以 LVQ 是一种监督式的聚类算法。其目标是学得一组原型向量,每一个原型向量代表一个聚类簇标记。
算法步骤
输入:训练集 D,聚类簇数量 p
输出:p 个原型向量
(1) 初始化原型向量;
(2) 计算距离:在训练集 D 中随机抽取一个样本 xj,分别计算该样本与各个原型向量间的距离,然后找出最近的原型向量 pi;
(3) 重置均值向量:如果样本 xj 与原型向量 pi 的类别相同,则让原型向量靠近样本xj ,否则远离: