【文献阅读笔记】Improved Deep Embedded Clustering with Local Structure Preservation

沐羽绝不摸鱼

已于 2024-01-22 10:18:08 修改

阅读量959

点赞数 18

分类专栏：文献阅读笔记文章标签：笔记神经网络机器学习

于 2024-01-22 10:12:36 首次发布

本文链接：https://blog.csdn.net/weixin_42949680/article/details/135741540

版权

文献阅读笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

标题（paper）：Improved Deep Embedded Clustering with Local Structure Preservation

期刊 + 时间 + 有无源代码： IJCA + 2017 + 没收集

作者： Xifeng Guo, Long Gao, Xinwang Liu, Jianping Yin

方法名及缩写： Improved Deep Embedded Clustering (IDEC) algorithm

算法框架： 在这里插入图片描述

流程图： 在这里插入图片描述

全连接的自编码器

主要创新点： 利用欠完备的自编码器考虑局部结构

动机： 1、定义的聚类损失可能会破坏特征空间，从而导致无代表性的无意义特征，从而影响聚类性能。2、聚类损失并不能保证局部结构的保存。因此，特征转换可能会被误导，导致嵌入空间的损坏。

目标函数：
$L=L_r+\gamma L_c$
$L_r$ 网络重构损失（平均平方误差）， $L_c$ 聚类损失（DEC的KL散度考虑的那个）
$L_r=\sum_{i=1}^n\|x_i-g_{W^{\prime}}(z_i)\|_2^2$
$L_r$ 就是将降噪自编码器中的 $\tilde{x}$ 这一步不要。

优化步骤： 梯度下降和反向传播（根据聚类结果微调encoders但是由于损失函数中考虑了重构损失，因此这里并没有舍弃decoders）

1、Update autoencoder’s weights and cluster centers.
$\begin{gathered} \frac{\partial L_{c}}{\partial z_{i}} =2\sum_{j=1}^K\left(1+\|z_i-\mu_j\|^2\right)^{-1}(p_{ij}-q_{ij})(z_i-\mu_j) \\ \frac{\partial L_c}{\partial\mu_j} =2\sum_{i=1}^n\left(1+\|z_i-\mu_j\|^2\right)^{-1}(q_{ij}-p_{ij})(z_i-\mu_j) \end{gathered}$

$\mu_j=\mu_j-\frac\lambda m\sum_{i=1}^m\frac{\partial L_c}{\partial\mu_j}$

decoders 权重：
$W^{\prime}=W^{\prime}-\frac\lambda m\sum_{i=1}^m\frac{\partial L_r}{\partial W^{\prime}}$
encoders 权重：
$W=W-\frac{\lambda}{m}\sum_{i=1}^{m}\left(\frac{\partial L_{r}}{\partial W}+\gamma\frac{\partial L_{c}}{\partial W}\right)$
Update target distribution ：在每 $T$ 次迭代中使用所有嵌入点更新目标分布: $x_i$ 的标签：
$s_i=\arg\max_jq_{ij}$
注解：（优缺点 + 随便想记的内容）