AP近邻传播聚类算法总结

最新推荐文章于 2025-04-25 10:00:00 发布

manjhOK

最新推荐文章于 2025-04-25 10:00:00 发布

阅读量8.4k

点赞数 7

分类专栏：机器学习文章标签：算法数据

本文链接：https://blog.csdn.net/manjhOK/article/details/78734025

版权

AP（Affinity Propagation）算法是一种2007年提出的半监督聚类算法，通过消息传递寻找数据点的聚类中心和隶属关系。它不需要预设聚类数，且允许数据点既是选民也是候选人。AP算法的关键在于更新责任度和可信度，这两个值的迭代直到达到稳定状态或最大迭代次数。自我相似性的值会影响聚类数量，而阻尼因子λ有助于算法快速收敛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

AP（Affinity Propagation）算法是Fery等在2007提出的一种基于近邻传播的半监督聚类算法。算法的基本思想是：首先通过消息传递机制来搜索网络中各个数据点的聚类中心以及数据点与数据中心之间的隶属关系，然后根据数据中心和顶点之间的隶属关系来对待聚类数据集进行划分，形成若干个具有特定意义的子集。该算法的优点众多，比如算法在聚类的过程中不需要明确确定与聚类个数相关的参数；聚类中心是待聚类数据的某个确切的数据点；算法的输入可以是对称的相似度矩阵，也可以是非对称的相似性矩阵。
从文献中可知，原始AP算法的输入为相似性为一个矩阵S，相似性矩阵可以是对称的，也可以是非对称的。另外，针对AP算法，所有的数据点都是潜在的聚类中心，所以相似性矩阵对角线上的数值s(i,j)进行统一赋值，一般是所有相似性的中位数或者平均值，叫做自身参考度（Preference），算法中可以通过调节自身参考度来控制聚类结果的粒度，自身参考度数值越大聚类结果的数量就越多，反之越少。AP算法中在迭代的过程中对两种信息进行更新：可信度（Avaliability）和责任度（Responsibility）。可信度用来表示网络中顶点i选择顶点j作为聚类中心的程度，定义为a(i,j)。责任度用来表示顶点j适合作为顶点i的聚类中心的程度，定义为r(i,j)。AP算法的对责任度和可信度更新的公式定义如公式4-1和4-2所示：

最低0.47元/天解锁文章