摘 要 在聚类过程中,多视角数据的高维性和稀疏性使视角内描述样本的不同特征对聚类结果的影响不同,同一样本在不同的视角中对聚类的贡献也不同.层次化区分视角内不同特征的权重和相同样本在不同视角内的权重是提高多视角聚类性能的重要因素.提出了具有特征级和样本级两级权重的多视角聚类(multi-view clustering based on two-level weights, MVC2W)算法.该算法引入了特征级和样本级注意力机制学习每个视角内不同特征的权重和每个样本在不同视角内的权重.两级注意力机制使算法在训练过程中能够更加关注重要的特征和重要的样本,更加合理地融合不同视角的信息,从而有效克服数据高维性和稀疏性对聚类结果的影响.此外,MVC2W将表征学习和聚类过程融为一体,协同训练、相互促进,进一步提升聚类性能.在5个稀疏程度不同的数据集上的实验结果表明:MVC2W算法的聚类性能比11个基线算法均有提升,尤其是在稀疏程度高的数据集上,MVC2W的提升更加显著.
关键词 多视角聚类;特征级权重;样本级权重;注意力机制;稀疏度
随着数字传感器的快速增长和社交网络的广泛应用,数据获取的方式和渠道越来越多样化.同一事件或样本可以从不同的视角收集不同类型的数据,对于单模态的数据也可以提取多种特征来描述样本,例如可以从图像中提取颜色、纹理等多种特征以捕获比例、遮挡、照明及旋转变化,从而提高图像识别的鲁棒性[1].通
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



