论文_阅读笔记

吸引子传播算法(Affinity Propagation, AP)

将数据点对之间的相似性度量作为输入,不需要人工选择聚类数量和初始点
算法核心:信息传播
基本思想:将全部样本看做网络的节点,通过网络中各边的消息传递,计算得到各样本点的聚类中心。
聚类过程中有两个消息在节点间传播:
1)吸引度(responsibility)
r(i,k) r ( i , k ) :表示点 k k 视作点i的聚类中心的适合程度,表示 ik i → k 的消息
2)归属度(availability)
a(i,k) a ( i , k ) :表示点 i i 选择点j作为其聚类中心的适合程度,表示 ki k → i 的消息。
r(i,j) r ( i , j ) a(i,j) a ( i , j ) 越大,表示点 k k 作为最终聚类中心的可能性越大

· 相似度:两个数据点之间的匹配程度。
· 偏好程度:一个数据点对于某个样例适用性的依赖程度

算法:通过不断迭代更新每个点的吸引度和归属度,知道收敛,产生m个聚类中心,并将其余点分配到相应的聚类中。
算法实现:
输入:相似矩阵S s(i,k)=||xixk||2
s(k,k) s ( k , k ) 表示点 k k 被选为聚类中心的可能性,又称为参考度p(preference)
若认为每个点作为聚类中心的可能性相同,则p取相同值
p值可取相似矩阵的中位数或最小值
· 当p值取中位数时,得到的聚类中心的数目相对适中
· 当p值取最小值时,得到的聚类中心数目相对较少
初始化:设置归属度矩阵A为0 a(i,k)=0
迭代:更新吸引度矩阵R和归属度矩阵A直至收敛

r(i,k)=s(i,k)maxkk{a(i,k)+s(i,k)} r ( i , k ) = s ( i , k ) − m a x k ′ ≠ k { a ( i , k ′ ) + s ( i , k ′ ) }

a(i,k)={iimax{0,r(i,k)}min{0,r(k,k)+ii,kmax{0,r(i,k)}}i=kik a ( i , k ) = { ∑ i ′ ≠ i m a x { 0 , r ( i ′ , k ) } i = k m i n { 0 , r ( k , k ) + ∑ i ′ ∉ i , k m a x { 0 , r ( i ′ , k ) } } i ≠ k

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值