热门算法总结 —— AP聚类

AP聚类是一种无需预设类数的聚类算法,源于2007年,通过数据点间的信息传递实现自动识别类中心。与K-Means相比,AP算法稳定且对初始条件不敏感,适用于非对称数据。尽管复杂度较高,但其优点在于确定性结果和广泛的数据适用性。在小明班级成绩聚类案例中,30名同学被分为学霸、普通和学渣三类。
摘要由CSDN通过智能技术生成

1、算法简介

(1)概述:AP聚类是在2007年的《Clustering by Passing Messages Between Data Points》一文中首次提出的一种新的聚类算法。该算法无需事先定义类数,而是在迭代过程中不断搜索合适的聚类中心,自动从数据点间识别类中心的位置及个数,使所有的数据点到最近的类代表点的相似度之和最大。算法开始时把所有的数据点均视作类中心,通过数据点间的“信息传递”来实现聚类过程。与传统的K-均值算法对初始类中心选择的敏感性相比,AP算法是一种确定性的聚类算法,多次独立运行的聚类结果一般都十分稳定。AP算法是在数据点的相似度矩阵上进行聚类的,聚类的目标是使数据点与其类代表点之间的距离达到最小化。

(2)主要用途:聚类分析。

(3)优缺点

[1] 优点:第一,与众多聚类算法不同,AP聚类不需要指定K(经典的K-Means)或者是其他描述聚类个数(SOM中的网络结构和规模)的参数;第二,一个聚类中最具代表性的点在AP算法中叫做E(Examplar),与其他算法中的聚类中心不同,E是原始数据中确切存在的一个数据点,而不是由多个数据点求平均而得到的聚类中心(K-Means);第三,多次执行AP聚类算法,得到的结果是完全一样的,即不需要进行随机选取初值步骤;第四,对距离矩阵的对称性没要求。AP通过输入相似度矩阵来启动算法,因此允许数据呈非对称,数据适用范围非常大,且误差平方和低。

[2] 缺点:第一,算法复杂度较高,

  • 4
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

稀饭居然不在家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值