AP聚类算法

最新推荐文章于 2024-10-12 23:00:43 发布

master_feng2009

最新推荐文章于 2024-10-12 23:00:43 发布

阅读量1.5w

点赞数 9

分类专栏：数据挖掘聚类算法 AP聚类文章标签：数据挖掘聚类算法 AP聚类

本文链接：https://blog.csdn.net/doctor_feng/article/details/18778921

版权

AP聚类算法是一种基于数据对象相似度的自动聚类方法。它通过迭代更新吸引度(R)和归属度(A)来寻找聚类中心。算法不需要预设聚类数，但计算复杂度高，且受参考度和阻尼系数影响。文中给出了AP算法的迭代公式，以及一个二维点的聚类实例，展示了如何找到聚类中心并划分数据对象。

摘要由CSDN通过智能技术生成

最近在学习AP聚类算法，网上找了好多资料（http://blog.csdn.net/dreamd1987/article/details/8923035， http://www.doc88.com/p-239796915955.html， http://www.doc88.com/p-886680412462.html），对于AP的迭代公式都不太相同，后经过验证找到了正确的迭代公式，总结一下，以后备用：

算法原理：

AP算法是一种根据数据对象之间的相似度自动进行聚类的方法，隶属于划分聚类方法的一种。数据对象之间的相似度根据不同的场景选择不同的衡量准则，如欧式距离，随相似准则的不同，数据对象之间的相似度可能是对称的，也可能是非对称的。这些相似度组成N*N（N为数据对象的数目）的相似矩阵S，利用该矩阵进行自动迭代计算。注：相似度矩阵应该是一个负值矩阵，即每个元素的值不能大于0，如果用欧式距离，那么取负值即可。

AP算法根据S对角线的数值最为某个点能否成为聚类中心的评判标准，该值越大，该点成为簇中心的可能性越大，对角线上的值称为参考度p。p的大小影响簇中心的数目，若认为每个数据对象都有可能作为簇中心，那么p就应该取相同的值（此时S对角线的值都为p），当然可以根据不同点成为簇中心的可能性大小，取不同的p值（此时S对角线上的值就会不同）。如果p等于S矩阵中所有元素的均值，那么得到的簇中心数目是中等的；如果取最小相似度，那么得到较少的聚类。

AP算法有两个重要的消息,Responsibility和Availability。R(i,k)描述了数据对象k适合作为数据对象i