AP聚类算法的理解

最新推荐文章于 2021-09-16 21:41:48 发布

工藤新一11111

最新推荐文章于 2021-09-16 21:41:48 发布

阅读量1.2k

点赞数

分类专栏：深度学习机器学习文章标签：机器学习深度学习算法

本文链接：https://blog.csdn.net/weixin_43177538/article/details/103063071

版权

机器学习同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

深度学习

3 篇文章 0 订阅

订阅专栏

B. J. Frey and D. Dueck, ,” Science, vol. 315, pp. 972–976, 2007.AP聚类算法是2007年提出的，AP的一个优点是聚类数目不用预先指定，它是在消息传递方法中慢慢浮现出来的，聚类数目取决于参考度，可以在多个数据中基于先验信息指定每一个数据点进行自动模型的选择，选择出来一个合适的示例作为exemplar。其中exemplar是聚类簇的中心。
一、变量说明：
1.数据样本集
2.相似度矩阵：s，大小为n乘n的矩阵。
3.数据点i与数据点j的相似度值（一般采用欧氏距离的相反数表示）
4.参考度（偏好函数）：Preference，矩阵s中横轴纵轴索引的点，表示数据点i作为聚类中心的程度，一般将其设置为相似度矩阵中的均值或最小值。
5.吸引（responsibility)信息矩阵：R,r(i,j)描述了数据对象j适合做数据对象i的聚类中心得程度，即表示的是从i到j的消息。
6.归属（avaliablity)矩阵A：a(i,j)描述了数据对象选择数据对象j作为其聚类中心的适合程度，表示从j到i的消息。
二、公式说明：
在这里插入图片描述

三、为了避免振荡，AP算法更新信息时引入衰减系数在这里插入图片描述，介于0和1之间，则：

6.AP算法的优点
1）不需要制定最终聚类族的个数
2）已有的数据点作为最终的聚类中心，而不是新生成一个族中心。
3）模型对数据的初始值不敏感。
4）对初始相似度矩阵数据的对称性没有要求。
5）.相比与k-centers聚类方法，其结果的平方差误差较小。