一张示意图看懂深度嵌入聚类DEC

生信碱移

已于 2024-09-23 15:47:41 修改

阅读量1.1k

点赞数 15

文章标签：聚类机器学习人工智能算法经验分享数据可视化数据挖掘

于 2024-09-23 15:47:20 首次发布

本文链接：https://blog.csdn.net/weixin_49214410/article/details/142460225

版权

深度嵌入聚类算法的架构。

步骤 1：根据输入数据集，训练自编码器将原始变量矩阵映射到潜在特征。

步骤 2：对潜在特征进行 K 均值聚类。

步骤 3-6：然后，为每个样本计算六个软标签，并估计目标分布，最大化高软标签和低软标签的分离。随后，优化自编码器的编码器，以最小化软标签与目标分布之间的 Kullback-Leibler 散度损失，进行 140 次迭代。

- 图源：Deep embedded clustering generalisability and adaptation for integrating mixed datatypes: two critical care cohorts | Scientific Reports

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

生信碱移

关注关注

15
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【数据聚类|深度聚类】Nearest Neighbor Matching for Deep Clustering（NNM）论文研读

快乐江湖的博客

04-21

920

翻译深度聚类逐渐成为无监督学习方法中重要的分支。然而，当前的方法几乎没有考虑到局部和全局特征中存在的语义样本关系。此外，由于深度特征是实时更新的，依赖于这些样本关系可能会构建更具语义置信度的样本对，从而导致性能下降。为了解决这个问题，我们提出了一种叫做最近邻匹配（NNM）的方法，将样本与其来自局部（批量）和全局（整体）水平的最近邻进行匹配。具体而言，对于局部级别，我们基于批嵌入特征匹配最近邻，对于全局级别，我们匹配来自整体嵌入特征的邻居。

人脸隐私保护研究综述

最新发布

qq_44111805的博客

05-21

随着人工智能和计算机视觉技术的迅猛发展，人脸采集与人脸识别技术在各个领域得到了广泛应用，从智能安防、社交媒体到金融支付等。然而，与此同时，人脸隐私保护的重要性也日益凸显。人脸信息作为一种生物特征数据，具有唯一性和不可更改性，一旦泄露或滥用，可能导致严重的隐私侵害和安全风险。因此，研究有效的人脸隐私保护技术显得尤为重要。人脸隐私保护研究旨在开发出保护个体隐私的同时，仍能满足人脸图像的某种实际应用需求的技术与方法，其中包括人脸视觉混淆、人脸匿名化、视觉数据加密，以及隐私保护人脸识别等方面的研究

参与评论您还未登录，请先登录后发表或查看评论

基础深度聚类算法——DEC与SDEC

crisps_ww的博客

11-12

1470

在DEC论文中，聚类过程通过KL散度（Kullback-Leibler Divergence）来优化，并涉及一个非线性映射和一组初始聚类中心。整个过程是一个迭代的无监督学习算法，交替执行步骤，直至满足收敛条件。（1）soft assignment软分配计算论文中详细解释了软分配（Soft Assignment）的计算方法，该方法基于Maaten和Hinton（2008）的研究。软分配是一种衡量嵌入点与聚类中心之间相似度的方法，允许一个样本属于多个聚类的概率分布。具体计算步骤如下：·计算距离。

【聚类算法解析系列07】聚类与深度学习的结合——深度嵌入聚类（DEC）

熵数实验室

03-27

1235

数据本质是连续流形上的概率分布，而非离散样本点的集合——这正暗合了爱因斯坦"场论"对经典力学的超越。在20量子位系统中，MNIST分类准确率达85%，耗时仅经典DEC的1/1000。其中系数比( \alpha:\beta:\gamma )决定优化轨迹的相变路径。：BraTS 2023脑肿瘤数据集（3D MRI，4模态）在100家医院联合训练中，模型AUC提升12%，数据不出域。在8xA100集群上，训练速度提升6.8倍。模型体积缩小至1/4，推理延迟降低至8ms。

DEC-DA：Deep Embedded Clustering with Data Augmentation

GYY8023的博客

04-06

1855

Deep Embedded Clustering with Data Augmentation1 摘要2 介绍3 相关工作3.1 Denoising Autoencoder3.2 Deep Embedded Clustering4 DEC_DA5 实验测试6 参考文献 1 摘要 DEC忽视了关键成分：数据增量，它被广泛应用于监督深度学习模型中，以提高泛化能力。因此，本文提出带有数据增量的深度嵌入...

探索未知：深度嵌入聚类IDEC

gitblog_00066的博客

06-12

762

探索未知：深度嵌入聚类IDEC 去发现同类优质开源项目:https://gitcode.com/ 项目介绍在数据挖掘和机器学习的世界中，无监督学习是一个充满挑战的领域，其中深度嵌入聚类（Deep Embedded Clustering, DEC）和其改进版本Improved DEC（IDEC）是近年来的重要研究进展。这个开源项目提供了在Keras框架下的IDEC实现，基于2017年IJCAI会议...

探索无监督聚类新境界：深度嵌入聚类（Deep Embedding Clustering, DEC）

gitblog_00562的博客

08-24

1083

探索无监督聚类新境界：深度嵌入聚类（Deep Embedding Clustering, DEC） DEC-kerasKeras implementation for Deep Embedding Clustering (DEC)项目地址:https://gitcode.com/gh_mirrors/de/DEC-keras 随着机器学习和深度学习的飞速发展，如何在无需标签数据的情况下高效地进行...

深度图嵌入聚类图例

小海鲜的博客

08-10

493

深度FCM+图嵌入 IDEC+图嵌入

【缺失多视图聚类】Subgraph Propagation and Contrastive Calibration for Incomplete Multiview Data Cluste

weixin_44184852的博客

09-12

1017

多视图原始数据挖掘的成功依赖于属性的完整性。然而，每个视图都面临各种噪声和收集失败，这导致属性仅部分可用的情况。更糟糕的是，多视图原始数据中的属性由多种形式组成，这使得数据的结构探索变得更加困难，尤其是在多视图聚类任务中。由于部分视图中存在缺失数据，不完整多视图数据上的聚类任务面临以下挑战，即：1）挖掘多视图中缺失数据的拓扑结构是亟待解决的问题；2）大多数方法没有用多视图的公共信息校准互补表示；3）我们发现从不完全视图获得的聚类分布在潜在空间中存在聚类分布不对齐问题（CDUP）。

图像生成2

whaosoft143ai的博客

10-30

1349

第一部太多了所以分开了要不太难看了~~ 生成模型是一种训练模型进行无监督学习的模型，即，给模型一组数据，希望从数据中学习到信息后的模型能够生成一组和训练集尽可能相近的数据。图像生成（Image generation，IG）则是指从现有数据集生成新的图像的任务。图像生成模型包括无条件生成和条件性生成两类，其中，无条件生成是指从数据集中无条件地生成样本，即p(y)；条件性图像生成是指根据标签有条件地从数据集中生成样本，即p(y|x)。图像生成也是深度学习模型应用比较广泛、研究程度比较深的一个主题，在几个著名

从理论支撑到具体应用，万字长文详述 CV 中 Transformer 的广阔天地

BAAIBeijing的博客

01-27

1718

写在前面——自 2017 年 Transformer 技术出现以来，便在 NLP、CV、语音、生物、化学等领域引起了诸多进展。知源月旦团队期望通过“Transformer+X” 梳理清 ...

dec-tensorflow:Tensorflow实现“用于聚类分析的无监督深度嵌入”

05-11

Tensorflow中的深度嵌入聚类（DEC）的Tensorflow实现。安装 >>> pip3 install -r requirements.txt 训练 usage: train.py [-h] [--batch-size BATCH_SIZE] [--gpu-index GPU_INDEX] optional arguments: -h, --help show this help message and exit --batch-size BATCH_SIZE Train Batch Size --gpu-index GPU_INDEX GPU Index Number 可视化 inference.py返回潜在表示形式（$ z $），并导出z.t

**深度嵌入聚类利器：pt-dec探索**

gitblog_01148的博客

08-15

527

深度嵌入聚类利器：pt-dec探索项目地址:https://gitcode.com/gh_mirrors/pt/pt-dec 在这个数据驱动的时代，无监督学习在挖掘数据潜在价值方面发挥着越来越重要的作用。今天要为大家介绍的，就是一款基于PyTorch框架实现的深度嵌入聚类（Deep Embedded Clustering）算法——pt-dec，它以其强大的功能和优秀的性能，在众多无监督学习工具中...

深度嵌入聚类 DEC 总结

Avery123123的博客

11-21

6765

Deep Embedded Cluster 概述动机贡献过程概述软分配目标分布（辅助分布）最小化KL散度（目标函数）结构图实现

DEC-Keras: 深度嵌入聚类的Keras实现

gitblog_00041的博客

04-18

415

DEC-Keras: 深度嵌入聚类的Keras实现 DEC-kerasKeras implementation for Deep Embedding Clustering (DEC)项目地址:https://gitcode.com/gh_mirrors/de/DEC-keras 是一个基于Python和Keras的深度学习库，用于无监督数据聚类。该项目由郭熙锋开发，旨在简化和加速深度嵌入聚类（D...

【数据聚类|深度聚类】Unsupervised Deep Embedding for Clustering Analysis(DEC)论文研读

快乐江湖的博客

03-01

1108

如何优化。

对聚类经典文献（DEC——无监督的深度嵌入式聚类）的学习（续）

llismine的博客

06-02

4673

本文主要是本人的学习心得，包括以下两个方面：一、对论文《无监督的深度嵌入式聚类》（DEC）相关知识的学习；二、对DEC代码的学习。详细讲解点击此处：（论文解读）DEC（Deep Embedded Clustering）是一种基于深度学习的无监督聚类方法，它通过将自编码器（Autoencoder）与K-Means聚类相结合来实现端到端的聚类任务。

【转】Deep Clustering Algorithms

boooiaji的博客

01-02

1444

全文转载自 https://www.cnblogs.com/kailugaji/p/12105939.html 阅读目录(Content)Deep Clustering Algorithms1. Deep Embedded Clustering1.1 Stochastic Neighbor Embedding (SNE)1.2 t-SNE1.3 Deep Embedded Clustering(DEC)2. Improved Deep Embedded Clustering(I

深度嵌入聚类MATLAB

01-02

### 关于深度嵌入聚类在MATLAB中的实现 #### 深度嵌入聚类简介深度嵌入聚类(Deep Embedded Clustering, DEC)是一种结合了自动编码器和传统聚类算法的方法。该方法首先利用自动编码器对高维数据进行降维表示，然后在此基础上执行聚类操作。这种方法不仅能够有效捕捉到数据的本质结构，还能显著提升聚类效果。 #### MATLAB环境下的DEC实现流程为了实现在MATLAB环境中构建并训练一个简单的深度嵌入聚类模型，下面是一个简化版的工作流： 1. **准备阶段** - 加载所需的数据集； - 对原始数据做标准化处理以适应后续的神经网络输入需求。 2. **搭建自编码器架构** 使用`matlab`内置函数创建一个多层感知机作为基础框架来充当自编码器的角色。 ```matlab % 定义自编码器结构 hiddenLayerSize = 10; % 隐藏层数量可以根据具体应用场景调整 autoenc = trainAutoencoder(trainData', ... 'NumHiddenUnits', hiddenLayerSize,... 'MaxEpochs', 400); ``` 3. **初始化聚类中心** 基于初步得到的低纬特征向量集合，采用K-means或者其他快速收敛的传统聚类方式获取初始聚类质心位置。 4. **目标函数定义与优化求解** 构建损失函数用于指导整个迭代过程直至满足停止条件为止。此过程中涉及到两个部分：一个是重构误差项用来保持样本间相对距离不变；另一个则是软分配概率分布之间的KL散度衡量差异程度最小化问题。 5. **更新权重参数** 利用反向传播机制不断调节各层节点间的连接强度即权值大小从而使得整体系统趋于稳定状态。 6. **最终分类标签预测** 当完成上述所有步骤之后便可以获得较为理想的簇划分方案进而赋予每一个测试实例相应的类别标识符。 7. **评估指标计算** 计算常见的内部有效性指数（如轮廓系数Silhouette Coefficient）、外部一致性测度（比如ARI Adjusted Rand Index）等统计学评价标准检验所提方案的有效性和合理性。 8. **结果可视化呈现** 将最后获得的结果借助图形化手段直观展现出来便于观察理解。 #### 示例代码片段这里给出一段核心伪代码帮助读者更快地上手实践： ```matlab function decModel = deepEmbeddedClustering(data,k) % data: 输入矩阵形式的数据集 % k: 设定好的期望簇数 %% Step 1 & 2 Train AutoEncoder and Extract Features autoEnc = ... ; % 自动编码器训练省略... features = encode(autoEnc,data'); %% Step 3 Initialize Cluster Centers via KMeans++ initCenters = initializeClusterCenters(features,k); %% Step 4 Define Objective Function objFunc = @(W,beta,q,z)decLoss(W,beta,q,z); %% Step 5 Optimize Weights Using Backpropagation Algorithm options = optimoptions('fminunc','Display','iter',... 'Algorithm','quasi-newton'); [weights,objVal] = fminunc(objFunc,[initWeights(:)',beta],options); %% Step 6 Predict Labels Based on Optimized Model Parameters qPred = predictLabels(weights,features'); end ```