DEC(Deep Embedded Cluster)小结

DEC是一种深度学习驱动的聚类方法,它结合了深度神经网络和聚类算法,尤其适用于高维数据。DEC通过学习低维特征表示并优化聚类分配,使用KL散度最小化来改进聚类效果。算法包括自动编码器预训练和聚类优化两个阶段,实现了聚类和特征学习的联合优化,提供了一种有效的非监督学习策略。
摘要由CSDN通过智能技术生成

Deep Embedded Cluster

简介

一般的聚类算法例如K-means,GMM,这些方法速度快,适用于各种各样的问题, 但是,它们的距离度量仅限于原始数据空间,当输入维度较高时,它们往往无效。因此突出DEC聚类,DEC可以同时学习使用深度神经网络的特征表示和聚类分配,DEC从数据空间学习映射到低维特征空间,在该特征空间中迭代地优化聚类目标。

DEC定义了一个基于质心的概率分布,并将KL散度最小化为一个辅助目标分布,以同时改善聚类分配和特征表示,而不是最小化KL散度以产生忠实于原始数据空间中的距离的嵌入。 基于质心的方法还具有降低 O(nk) 的复杂度的优点,其中k是质心的数量。

DEC通过同时学习特征空间Z中的k个聚类中心 { u j ∈ Z } j = 1 k \{u_{j} \in Z\}_{j=1}^k { ujZ}j=1k 和将数据点映射到Z的DNN的参数 θ \theta θ 来聚类数据。DEC具有两个阶段:( 1)使用自动编码器进行参数初始化,(2)参数优化(即聚类),其中我们在计算辅助目标分布和最小化Kullback-Leibler(KL)散度之间进行迭代。

贡献:
(a)深度嵌入和聚类的联合优化;
(b)通过软分配进行新颖的迭代改进;
(c)得出聚类精度和速度方面最先进的聚类结果;

KL散度

给定非线性映射 f θ f_{\theta} fθ 和初始聚类质心 { u j } j = 1 k \{u_{j}\}_{j=1}^{k} { uj}j=1k 的初始估计,DEC使用在两个步骤之间交替的无监督算法来改进聚类。 在第一步中,我们计算嵌入点和集群质心之间的软分配。 在第二步中,我们更新深度映射 f θ f_{\theta} fθ 并通过使用辅助目标分布从当前高置信度分配中学习来优化聚类质心。 重复这个过程直到满足收敛条件。

软分配

基于 t-sne 的思想,DEC使用 t 分布作为核来测量嵌入点和质心之间的相似度。
q i j = ( 1 + ∣ ∣ z i − u j ∣ ∣ 2 / α ) α + 1 2 ∑ j ‘ ( 1 + ∣ ∣ z i − u j ‘ ∣ ∣ 2 / α ) α + 1 2 q_{ij}=\frac{(1+||z_{i}-u_{j}||^2/\alpha)^\frac{\alpha+1}{2}}{\sum_{j^`}(1+||z_{i}-u_{j^`}||^2/\alpha)^\frac{\alpha+1}{2}} qij=j(1+ziu

  • 4
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值