聚类
ddana_a
这个作者很懒,什么都没留下…
展开
-
kmeans
参考转载 2020-09-14 08:38:39 · 57 阅读 · 0 评论 -
DEC
算法(DEC)通过同时学习特征空间Z中的k个聚类中心{μj∈Z} j = 1 … k和将数据点映射到Z的DNN参数θ来对数据进行聚类。两个阶段:(1)使用深度自动编码器进行参数初始化和(2)参数优化(即,聚类),在此过程中,我们在计算辅助目标分布与最小化Kullback-Leibler(KL)差异之间进行迭代。我们从描述阶段(2)参数优化/聚类开始,给定θ的初始估计值,且{µj} j = 1,… k。KL聚类给定非线性映射fθ的初始估计和初始聚类质心{μj} kj = 1,我们建议使用在两步之间交替的无翻译 2020-08-05 13:54:40 · 1652 阅读 · 1 评论 -
各种深度聚类方法摘要
Spectral Clustering with Graph Neural Networks for Graph Pooling频谱聚类(SC)是一种流行的聚类技术,用于在图形上查找强连接的社区。 SC可以在图形神经网络(GNN)中使用,以实现汇总属于同一群集的节点的池化操作。但是,拉普拉斯算子的特征分解是昂贵的,并且由于聚类结果是特定于图的,因此基于SC的合并方法必须为每个新样本执行新的优化。在本文中,我们提出了一种图聚类方法来解决SC的这些局限性。我们制定了标准化minCUT问题的连续松弛,并训练了G原创 2020-08-05 09:12:13 · 6890 阅读 · 0 评论 -
使用伪半监督学习的无监督聚类
提出两个问题:是否有可能仅使用无监督技术来创建半监督方法所需的小标签数据集?如果是这样,半监督方法是否可以利用这种自动生成的伪标记数据集来提供比最新的无监督方法更高的性能?为了自主创建高精度的伪标记数据集,我们将深度网络的集成与自定义图聚类算法结合使用(第4节)。我们首先以无人监督的方式训练一组深层网络。每个网络独立地对输入进行聚类。然后,我们比较两个输入数据点。如果所有网络都同意这两个数据点属于同一群集,则可以合理确定这些数据点属于同一类。这样,我们以完全不受监督的方式高精度地识别了属于同一类的所有输入翻译 2020-07-31 13:48:42 · 1496 阅读 · 3 评论 -
underlying manifold+clustering
深度聚类算法通常将表示学习与深度神经网络相结合以实现这一性能,通常可以优化聚类和非聚类损失。在这种情况下,自动编码器通常与集群网络连接,并且最终的集群由自动编码器和集群网络共同学习。取而代之的是,我们建议学习自动编码的嵌入,然后在其中进一步搜索底层的流形。为了简单起见,我们然后使用浅层聚类算法而不是更深层的网络对其进行聚类。我们在原始数据和自动编码的嵌入方面研究了许多本地和全局流形学习方法,得出结论,我们框架中的UMAP能够找到最佳的可聚类嵌入流形。这表明在自动编码的嵌入上进行局部流形学习对于发现更高质量的原创 2020-07-24 14:18:01 · 429 阅读 · 0 评论 -
几种聚类评估指标
S_Dbw参考博客指标越小聚类结果越好轮廓系数参考博客指标越接近1聚类结果越好Calinski-Harabaz(CH)参考博客指标越大聚类结果越好DBI参考博客指标越小聚类结果越好原创 2020-07-23 08:59:34 · 1036 阅读 · 0 评论