Deep Discriminative Latent Space for Clustering 理解梳理

最新推荐文章于 2024-07-22 02:06:53 发布

邵东恒的技术博客

最新推荐文章于 2024-07-22 02:06:53 发布

阅读量698

点赞数

分类专栏： clustering

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shaodongheng/article/details/83047758

版权

clustering 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Deep Discriminative Latent Space for Clustering 理解梳理

翻译链接：https://blog.csdn.net/shaodongheng/article/details/83021629

网络结构图：

两个部分的算法：

预训练阶段：

是最大迭代次数， $\lambda \in \left ( 0,1 \right ]$ ， $L_{d}^{i}$ 是第 i 次迭代方程：

的结果， $\epsilon$ 是一个很小的数。

计算数据集原始表示的k最近邻， $A_{B}$ 是选择的锚对的集合，表示该集合的样本数。

锚对：将k-最近邻图中具有最大相似性的一部分作为锚对。

设定作为潜在空间的归一化的表示。

潜在表示矩阵，其中 $\left | B \right |$ 表示每一批次的样本数目，将 $\tilde{Z}$ 定义为行归一化批量矩阵（其第i行是行向量 $\tilde{z}_{i}^{T}$ ），并且将定义为成对余弦相似度矩阵，使得。

α<1是超参数。

最小化损失函数：

其中λ代表正则化强度，即系数，表示重构损失，X代表原始输入批次的矩阵， $\left | \cdot \right |$ 代表Frobenius范数。

由此得到了预训练的自动编码器参数 $\theta _{e}$ 和自动解码器参数 $\theta _{d}$ 。

聚类阶段：

第一阶段：

优化过程从的初始化开始，在整个数据集D上通过优化等式（7），即最大化：

得到初始化的。

然后我们交替优化参数，即优化一个时其他保持不变，先最大化目标函数得到分配矩阵S，然后最大化得到，最后最大化得到自动编码器参数。优化过程迭代直到收敛。

将前面预训练阶段得到的模型参数 $\theta _{e}$ ， $\theta _{d}$ 带入，是聚类簇的质心，S 是分配矩阵（权重矩阵），

。

是超参数

初始化

更新 $\mu_{k}^{}$ ：

更新 $\theta _{e}$ 和 $\theta _{d}$ ：

第二阶段：

采用第一阶段得到的参数初始化。

与第一阶段只是优化函数不同：

其中：

邵东恒的技术博客

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。