DEC(Deep Embedded Cluster)小结

最新推荐文章于 2025-03-27 09:00:00 发布

AndyViky

最新推荐文章于 2025-03-27 09:00:00 发布

阅读量7.1k

点赞数 4

分类专栏：知识梳理 AI 文章标签：机器学习 clusting 深度学习

本文链接：https://blog.csdn.net/AndyViky/article/details/94159565

版权

DEC是一种深度学习驱动的聚类方法，它结合了深度神经网络和聚类算法，尤其适用于高维数据。DEC通过学习低维特征表示并优化聚类分配，使用KL散度最小化来改进聚类效果。算法包括自动编码器预训练和聚类优化两个阶段，实现了聚类和特征学习的联合优化，提供了一种有效的非监督学习策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Deep Embedded Cluster

简介

一般的聚类算法例如K-means，GMM，这些方法速度快，适用于各种各样的问题，但是，它们的距离度量仅限于原始数据空间，当输入维度较高时，它们往往无效。因此突出DEC聚类，DEC可以同时学习使用深度神经网络的特征表示和聚类分配，DEC从数据空间学习映射到低维特征空间，在该特征空间中迭代地优化聚类目标。

DEC定义了一个基于质心的概率分布，并将KL散度最小化为一个辅助目标分布，以同时改善聚类分配和特征表示，而不是最小化KL散度以产生忠实于原始数据空间中的距离的嵌入。基于质心的方法还具有降低 O(nk) 的复杂度的优点，其中k是质心的数量。

DEC通过同时学习特征空间Z中的k个聚类中心 $\{u_{j} \in Z\}_{j=1}^k$ 和将数据点映射到Z的DNN的参数 $\theta$ 来聚类数据。DEC具有两个阶段:( 1）使用自动编码器进行参数初始化，(2）参数优化（即聚类），其中我们在计算辅助目标分布和最小化Kullback-Leibler（KL）散度之间进行迭代。

贡献：
（a）深度嵌入和聚类的联合优化;
（b）通过软分配进行新颖的迭代改进;
（c）得出聚类精度和速度方面最先进的聚类结果；

KL散度

给定非线性映射 $f_{\theta}$ 和初始聚类质心 ${u_{j}\}_{j=1}^{k}$ 的初始估计，DEC使用在两个步骤之间交替的无监督算法来改进聚类。在第一步中，我们计算嵌入点和集群质心之间的软分配。在第二步中，我们更新深度映射 $f_{\theta}$ 并通过使用辅助目标分布从当前高置信度分配中学习来优化聚类质心。重复这个过程直到满足收敛条件。

软分配

基于 t-sne 的思想，DEC使用 t 分布作为核来测量嵌入点和质心之间的相似度。
$q_{ij}=\frac{(1+||z_{i}-u_{j}||^2/\alpha)^\frac{\alpha+1}{2}}{\sum_{j^`}(1+||z_{i}-u_{j^`}||^2/\alpha)^\frac{\alpha+1}{2}}$

最低0.47元/天解锁文章