集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译

最新推荐文章于 2023-04-14 23:57:53 发布

Antony Lambert

最新推荐文章于 2023-04-14 23:57:53 发布

阅读量1.5k

点赞数 5

分类专栏：机器学习集成学习聚类文章标签：聚类机器学习算法 ieee论文集成学习

本文链接：https://blog.csdn.net/qq_41997070/article/details/119768643

版权

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

这部分用于阐明如何进行随机游走，以及产生一个新的cluster-wise similarity matrix（该矩阵并不是ECA矩阵）。具体而言，分为以下两个步骤。

1）构造图G（V,E），其中V代表所有的簇的集合，边集 $E=\{e_{ij}=Jaccard(C_i,C_j)|0\leqslant i,j\leqslant N^c\}$ 这是initial similarity graph。关于Jaccard相关系数可以点击这里。
2）加入multiscale信息，具体的方法为首先构造一个概率转移矩阵，再通过概率转移矩阵构造一个新的相似度矩阵。
      2.1)构建单步概率转移矩阵

      2.2)多步概率转移矩阵
从节点 $C_i$ 开始进行t步的随机游走（random walk），定义符号 $P^{(1:t)}_{i:}=\{P^{(1)}_{i:},P^{(2)}_{i:},...,P^{(t)}_{i:}\}$ 代表随机游走的轨迹，其中 $P^{(t)}_{i:}=\{P^{(t)}_{i1},P^{(t)}_{i2},...,P^{(t)}_{iN}\}$
新的相似度矩阵 $Z=\{z_{ij}\}_{N_c*N_c}$ ，其中 $z_{ij}=Sim(P^{(1:t)}_{i:},P^{(1:t)}_{j:})$ , $S i m (\cdot, \cdot)$ 是某种相似度衡量方式。文章采用的是余弦相似度。

得到相似度矩阵Z以后，继续将其（簇级别）映射至对象级别。
首先，对于每一个基聚类器，构建一个矩阵 $A^m$ ，这个矩阵描述了每一个簇中包含有的样本。再根据 $A^m$ 构建共关联矩阵 $A$ 。具体如图下图所示。
根据两个相似度矩阵 $Z$ 和 $A$ ，得到新的ECA矩阵，这个矩阵不仅考虑了co-coccurrence，还考虑了multiscale cluster-wise similarity。