som神经网络聚类简单例子_深度聚类的可视化解释

DeepCluster是一种自监督学习方法,通过结合无监督聚类与深度神经网络进行端到端学习。本文介绍了DeepCluster的工作流程,包括图像增强、特征提取、PCA降维、K-means聚类等步骤,以及如何使用AlexNet进行表示学习。通过迭代训练,DeepCluster能够为大量无标签数据生成有用的伪标签,适用于预训练模型的构建。
摘要由CSDN通过智能技术生成

作者:Amit Chaudhary

编译:ronghuaiyang

导读

视觉上的自监督学习方法,结合聚类,将无监督转变为有监督。

许多自监督方法使用[pretext tasks](https://amitness.com/2020/02/illustrated-selfsupervision -learning/)来生成代理标签,并将无监督学习问题转化为有监督学习的问题。一些例子包括旋转预测,图像着色,拼图等。然而,这样的pretext任务是依赖于领域的,需要专业知识来设计它们。

DeepCluster是Facebook AI研究的Caron等人提出的一种自监督方法,带来了一种不同的方法。这种方法不需要特定于领域的知识,可以用于学习缺乏注释数据的场景的深层表示。

DeepCluster

DeepCluster结合了两部分:无监督聚类和深度神经网络。提出了一种端到端联合学习深度神经网络参数及其表示的聚类分配的方法。这些特征被迭代地生成和聚合,最后得到一个训练过的模型和标签作为输出结果。

Deep Cluster Pipeline

现在让我们了解一下深度聚类的pipleline是如何工作的。

ff51725261b2fc58607173e8b1a62565.gif

End to End Pipeline of DeepCluster Paper

简介

如上图所示,将拍摄未标记的图像并对其应用图像增强。然后,使用AlexNetvgg16ConvNet架构作为特征提取器。首先,对ConvNet进行随机权值初始化,并在最终的分类头之前从层中取特征向量。然后使用PCA特征向量进行降维,同时进行白化和L2归一化。最后,将处理后的特征传递到K-means,对每幅图像进行聚类分配。

这些聚类分配被用作伪标签,并训练ConvNet来预测这些聚类。用交叉熵损失来衡量模型的性能。模型训练了100个epoch,每个epoch进行一次聚类的操作。最后,我们可以将学到的表示用于下游任务。

手把手的例子

让我们通过一个从输入数据到输出标签的整个pipeline的一步步例子来看看DeepCluster是如何实际应用的:

1. 训练数据

我们从ImageNet数据集中提取未标记的图像,该数据集包括130万张图像,均匀分布在1000个类中。这些图像的minibatch为256。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值