AP聚类算法原理分析

AP聚类算法:

AP算法在开始时,将所有的节点都看成潜在的聚类中心,然后通过节点之间的通信找到最合适的聚类中心。
输入为节点间的相似度矩阵S:
其中S(i,j)表示节点i与节点j之间的相似度,也表明了j作为i的聚类中心的合适程度。
S(k,k)表示节点k作为k的聚类中心的合适程度,即节点k成为聚类中心的合适程度。
在最开始的时候,这个值是初始化时使用者给定的值,会影响到最后的聚类数量

AP节点之间传递消息为两类:吸引度和归属度

首先,吸引度是节点i向节点k的信息,传递了节点k对节点i的吸引度,记为r(i,k)
首先我们有相似度矩阵记录了k成为i的聚类中心的合适程度S(i,k),那么这里我们只需要证明k比其他节点更适合就可以了,对于其他节点k’,我们有S(i,k’)表示节点k‘作为节点i的聚类中心的合适度。
那么再定义一个a(i,k’)表示i对于节点k’的认可度(归属度)
这两个值相加,a(i,k‘)+S(i,k’)就可以计算出节点k‘作为节点i的聚类中心的合适程度。
这里,在所有其他节点节点k’中找到最大的a(i,k‘)+S(i,k’)即,max {a(i,k‘)+S(i,k’)}
再使用S(i,k)-max{a(i,k‘)+S(i,k’)}就可以得到k对于i的吸引度了:r(i,k)=S(i,k)-max{a(i,k‘)+S(i,k’)}

接下来计算上面提到的归属度a(i,k),表示了节点i选择节点k作为它的聚类中心的合适程度。

思想:

如果节点k作为其他节点i‘的聚类中心的合适程度很大,那么节点k作为节点i的聚类中心的合适程度也可能很大。
然后就可以先计算节点k对其他节点的吸引度r(i’,k)然后做一个累加和表示节点k对其他节点的吸引度:∑max{0,r(i‘,k)}
然后再加上r(k,k)这里为什么要加上r(k,k),根据吸引度公式我们可以看出,其他r(k,k)反应的是节点k有多不适合被划分到其他聚类中心。
即,a(i,k)=min{0,r(k,k)+∑max{0,r(i‘,k)}}
a(k,k)=∑max{0,r(i’,k)}主要反应了k作为聚类中心的能力
这里写图片描述

以选举代表为例:

S(i,k)就相当于i对选k这个人的一个固有的偏好
r(i,k)表示S(i,k)减去最强竞争对手的评分,可以理解为k对i这个选民的竞争中的优势程度
r(i,k)的更新过程对应选民i对各个参选人的挑选(超出众超有吸引力)
a(i,k):从公式里可以看到,所有r(i‘,k)>0的值都对a有正的加成
即,选民i通过网上关于k的民意调查看到:有很多人(i’)都觉得k不错(r(i‘,k)>0),那么选民i也就会相应的觉得k不错,是个可以相信的选择。
a(i,k)的更新过程对应关于参选人k的民意调查对于选民i的影响。(已经有很多跟随者的人更有吸引力)
两者交替的过程也就可以理解为选民在各个参选人之间不断的比较和不断的参考各个参选人给出的民意调查
r(i,k)的思想反应的是竞争,a(i,k)这是为了让聚类更加成功。

  • 4
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值