【文献阅读笔记】【标题：Deep auto-encoder based clustering】

沐羽绝不摸鱼

于 2024-01-09 21:21:53 发布

阅读量980

点赞数 22

分类专栏：文献阅读笔记文章标签：笔记机器学习人工智能神经网络

本文链接：https://blog.csdn.net/weixin_42949680/article/details/135489984

版权

文献阅读笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

标题（paper）：Deep auto-encoder based clustering

期刊 + 时间 + 有无源代码： Intelligent Data Analysis 2014 个人没收集

作者： Chunfeng Songa, Yongzhen Huang, Feng Liu, Zhenyu Wang, and Liang Wang

方法名及缩写： Deep auto-encoder based clustering

算法框架： 在这里插入图片描述

流程图：
在这里插入图片描述

模型主要两个部分：1. 自编码器部分 2. 聚类步骤（迭代的计算每个样本点离其最近簇的距离并重新分配簇，直至收敛，此时的簇为最终距离结果）

主要创新点： 将深度自编码器网络扩展到了聚类情况

动机：

1、原始数据由于存在大方差而不能很好地分布，那么传统的聚类算法无法提供从原始空间到特征空间的高度非线性转换，很难达到令人满意的性能。

2、然而，自编码器对聚类的贡献很小，因为它不追求相似的输入数据在特征层中获得相同的表示。

目标函数：

Eq.(4)
$\min_{W,b}\frac1N\sum_{i=1}^N\|x_i-x_i^{\prime}\|^2+\lambda\cdot\sum_{i=1}^N\|f^t(x_i)-c_i^*\|^2$
$x^{'}_i$ 是经过自编码器重构后的样本数据。

$f^t(x_i)$ 是第 $t$ 次迭代后样本点 $x_i$ 对应在特征空间中的表示。

$c^*_i$ 是特征空间中离第i个样本最近的簇中心。

Eq.(5)
$c_i^*=\arg\min_{c_j^{t-1}}\|f^t(x_i)-c_j^{t-1}\|^2$
整体公式：点 $x_i$ 映射到特征空间后的点离第 $j$ 个类中心点的距离，最小

$c^{t-1}_j$ 第 $t - 1$ 次迭代所产生的第 $j$ 个簇中心

优化步骤：

Update $f (.)$

Update $c$ : Eq.(6):
$c_j^t=\frac{\sum_{x_i\in C_j^{t-1}}f^t(x_i)}{|C_j^{t-1}|},$
$C^{t-1}_j$ 是第 $t - 1$ 次迭代中第 $j$ 个簇， $|C^{t-1}_j|$ 是簇中的样本点个数

注解：（优缺点 + 随便想记的内容）

1、自编码器的参数利用stochastic gradient descent (SGD) 随机梯度下降进行调参

2、这是一篇会议扩展论文，其会议原文(Auto-encoder Based Data Clustering )发表在Iberoamerican Congress on Pattern Recognition
会议原文和这一篇核心点一摸一样，唯一不同的是作者将实验部分进行了扩充，从而转投了一篇期刊。这一点作者在这篇论文的第二章相关工作中介绍深度神经网络的时候提到了。