【文献阅读笔记】Deep Clustering with Convolutional Autoencoder

最新推荐文章于 2024-06-02 09:59:34 发布

沐羽绝不摸鱼

最新推荐文章于 2024-06-02 09:59:34 发布

阅读量974

点赞数 20

分类专栏：文献阅读笔记文章标签：笔记神经网络机器学习

本文链接：https://blog.csdn.net/weixin_42949680/article/details/135646821

版权

文献阅读笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

这篇文章介绍了DeepConvolutionalEmbeddedClustering(DCEC)，一种改进的深度聚类方法，它利用卷积自编码器(CAE)学习图像特征并保持局部结构。DCEC融合了CAE的特征提取和聚类步骤，通过优化重构损失和聚类损失来控制数据的扭曲程度。作者针对现有深度聚类算法的局限提出了创新解决方案。

摘要由CSDN通过智能技术生成

标题（paper）：Deep Clustering with Convolutional Autoencoders

期刊 + 时间 + 有无源代码： nternational Conference on Neural Information Processing - 2017 - 有

作者： Xifeng Guo, Xinwang Liu, En Zhu, and Jianping Yin

方法名及缩写： Deep Convolutional Embedded Clustering (DCEC)

算法框架：

流程图： 在这里插入图片描述

卷积自编码示意图，Conv 卷积层，Flatten平铺操作， $h$ 嵌入层，FC 全连接层， DeConv 卷积转置层。这种CAE结构不需要分层预训练。

在这里插入图片描述

DCEC流程图 clustering layers可以参考DEC

主要创新点： DCEC中同时利用了CAE和局部结构的优点。个人感觉像是将卷积自编码器和聚类步骤融合。

关键思想是CAE有利于图像特征的学习，并保持数据的局部结构，避免特征空间的失真。

动机： 1、现有的深度聚类算法要么不能很好地利用卷积神经网络，要么不能很好地保留学习到的特征空间中数据生成分布的局部结构。

2、讨论什么类型的神经网络适合于特征提取？特征空间中应该保留数据的哪些属性？的这两个问题。

目标函数：
$L=L_r+\gamma L_c$
$L_r$ 是重构损失， $L_r$ 是聚类损失， $\gamma >0$ 是控制嵌入空间扭曲程度的系数(本文 $\gamma=0.1$ )

$L_c$ 的定义和DEC基本一致。

优化步骤： 首先 $\gamma=0$ 预训练参数，预训练后，通过对所有图像的嵌入特征执行k-means来初始化聚类中心。

其次， $\gamma=0.1$ 更新CAE的权值，聚类中心，目标分布 $P$ （想了解可以查原文，本身文中写的就不多，我感觉基本和DEC优化公式和方法一致）

注解：（优缺点 + 随便想记的内容）

1、这篇论文可以看作是DEC的改进。作者在文中提到DEC仅考虑了聚类损失，没有考虑编码损失，并且忽略了解码步骤，同时根据聚类结构动态调整编码结构等问题（可以查这篇论文，里面又讨论）。

2、对于卷积网络参数设置上：
$\mathrm{conv}_{32}^5\to\mathrm{conv}_{64}^5\to\mathrm{conv}_{128}^3\to\mathrm{FC}_{10}$
$conv^k_n$ 表示有 $n$ 个滤波器的卷积层，默认核大小为 $k\times k$ ，步长为2。

Convolutional AutoEncoders 卷积自编码器

组成：编码器encoder $f_W()$ 和解码器decoder $g_U()$

目标：通过最小化所有样本的输入和输出之间的均方误差(MSE)来找到每个输入样本的代码
$\begin{aligned}\min_{W,U}\frac1n\sum_{i=1}^n\|g_U(f_W(x_i))-x_i\|_2^2\end{aligned}$
全连接自编码器（一般的自编码器）：
$\begin{aligned}f_W(x)&=\sigma(Wx)\equiv h\\g_U(h)&=\quad\sigma(Uh)\end{aligned}$
$x$ 和 $h$ 是向量， $\sigma()$ 是激活函数