聚类论文
关于多视角和经典的单视聚类论文
Robert_Gordon
怕什么真理无穷,进一寸有一寸的欢喜!
展开
-
Re-Weighted Discriminatively Embedded K-Means for Multi-View Clustering
RDEKM这篇论文的创新点:提出一个多视图最小绝对残差模型。原来的多视K均值聚类的方法是采用非负矩阵分解,如公式所示:其聚类性能数据异常值的很大影响。基于此本论文提出一个多视最小绝对残差的模型,其中WkW_kWk表示的是一个投影矩阵,对高维数据进行降维,避免维度诅咒。在模型中残差∥.∥F\left \| . \right \|_F∥.∥F没有进行平方,所以可以减少离群值的影响,并具有很好的鲁棒性。目标函数为:其中...原创 2020-08-01 17:01:08 · 495 阅读 · 0 评论 -
Binary Multi-View Clustering(基于二进制的多视图聚类)
本篇论文是一篇关于二进制的多视聚类文章,用于处理大规模的多视数据集。1、首先对多视数据进行哈希编码本论文在第v个视图的数据中随机选取m个样本或者通过k-mean算法直接生成m个子簇中心amva_m^{v}amv来表达这个视图的数据分布,然后计算xsvx_s^vxsv于amva_m^{v}amv的核函数。之后乘上对其进行降维,并通过sgn()符号函数得到第v个视图的哈希矢量。2、学习一个统一的哈希矢量因为是多视图学习,所以一共有M个视角的哈希矢量hsvh_s^vhsv,从中学习一个统一的原创 2020-08-01 16:29:37 · 1124 阅读 · 1 评论 -
[KDD 2019] K-Multiple-Means(K多均值聚类)
原文作者链接本次描述地这篇论文是《K-Multiple-Means: A Multiple-Means Clustering Method with Specified K Clusters》,这是一篇关于多原型聚类地文章。众所周知,K-means是一种非常流行地聚类方法,使用一个质心对每一类的数据进行建模,在大多数的数据分布中能取得很好的效果。但是对于双月牙形这种非凸图案,得到的聚类结果很差。由此作者提出了一种新的多原型聚类的方法——KMM(K多均值聚类)。不同于以往的原型聚类方法(层次聚类),即先原创 2020-08-01 16:04:59 · 1724 阅读 · 2 评论 -
自适应近邻的多视图聚类
多视图聚类 对最近看的论文的一个总结。Multi-View Clustering and Semi-Supervised Classification with Adaptive Neighbours(MLAN) 聂飞平将单一视图的CAN推广到多视聚类,即MLAN。 单视CAN聚类的目标函数为:推广到多视聚类MLAN:其中wvw_vwv是每个视图的权重,这里的权重是自动分配,不需要添加参数。 我在这里理解wvw_vwv参数的含义是将距离的平方开根号,减少离群点的重要性,不知道我理解原创 2020-06-11 13:10:22 · 3995 阅读 · 14 评论 -
自适应近聚类(Clustering and Projected Clustering with Adaptive Neighbors)
在谱聚类中,构造邻接矩阵时,对于每个边的权重需要用高斯核函数来构造,对此需要调节参数σ\sigmaσ,嗯嗯…我们知道调参是一件很无意义的事情,鲁棒性不是很好。那么如何解决这个问题? 聂飞平大佬14年提出了自适应近邻构造图的方法(CAN),Clustering and Projected Clustering with Adaptive Neighbors,接下来我们简单的介绍一下CAN方法。 该算法的含义很简单:“距离较小的数据点成为邻居的可能性较大”这一先验知识的前提下,引入了概率邻居,在原创 2020-06-11 10:52:29 · 5788 阅读 · 33 评论 -
谱聚类算法(Spectral Clustering)的简单介绍
谱聚类(spectral clustering)是广泛使用的聚类算法,数据分布的适应性很强,(对于非簇状分布的数据也能起到很好的效果)聚类效果也很优秀,同时聚类的计算量也小很多,被大家广泛使用。1、谱聚类概述 谱聚类的基本思想很简单,利用从数据中得到的特征矩阵实现聚类,依靠两个部分完成聚类工作,第一个部分为图的构造,第二个部分对构造好的图,诱导出拉普拉斯矩阵并做特征分解,求特征向量,将数据嵌入到特征向量空间,进而实现聚类。 在介绍谱聚类之前先简单的回顾下图论和拉普拉斯矩阵的有关知识。2、图论原创 2020-06-11 09:24:41 · 1470 阅读 · 0 评论