som神经网络聚类简单例子_深度聚类的可视化解释

最新推荐文章于 2024-07-22 12:44:44 发布

weixin_39531780

最新推荐文章于 2024-07-22 12:44:44 发布

阅读量1.8k

点赞数 3

文章标签： som神经网络聚类简单例子

DeepCluster是一种自监督学习方法，通过结合无监督聚类与深度神经网络进行端到端学习。本文介绍了DeepCluster的工作流程，包括图像增强、特征提取、PCA降维、K-means聚类等步骤，以及如何使用AlexNet进行表示学习。通过迭代训练，DeepCluster能够为大量无标签数据生成有用的伪标签，适用于预训练模型的构建。

摘要由CSDN通过智能技术生成

作者：Amit Chaudhary

编译：ronghuaiyang

导读

视觉上的自监督学习方法，结合聚类，将无监督转变为有监督。

许多自监督方法使用[pretext tasks](https://amitness.com/2020/02/illustrated-selfsupervision -learning/)来生成代理标签，并将无监督学习问题转化为有监督学习的问题。一些例子包括旋转预测，图像着色，拼图等。然而，这样的pretext任务是依赖于领域的，需要专业知识来设计它们。

DeepCluster是Facebook AI研究的Caron等人提出的一种自监督方法，带来了一种不同的方法。这种方法不需要特定于领域的知识，可以用于学习缺乏注释数据的场景的深层表示。

DeepCluster

DeepCluster结合了两部分：无监督聚类和深度神经网络。提出了一种端到端联合学习深度神经网络参数及其表示的聚类分配的方法。这些特征被迭代地生成和聚合，最后得到一个训练过的模型和标签作为输出结果。

Deep Cluster Pipeline

现在让我们了解一下深度聚类的pipleline是如何工作的。

End to End Pipeline of DeepCluster Paper

简介：

如上图所示，将拍摄未标记的图像并对其应用图像增强。然后，使用AlexNet或vgg16等ConvNet架构作为特征提取器。首先，对ConvNet进行随机权值初始化，并在最终的分类头之前从层中取特征向量。然后使用PCA对特征向量进行降维，同时进行白化和L2归一化。最后，将处理后的特征传递到K-means，对每幅图像进行聚类分配。

这些聚类分配被用作伪标签，并训练ConvNet来预测这些聚类。用交叉熵损失来衡量模型的性能。模型训练了100个epoch，每个epoch进行一次聚类的操作。最后，我们可以将学到的表示用于下游任务。