变分自编码器VAE：一步到位的聚类方案

最新推荐文章于 2024-08-17 10:50:44 发布

PaperWeekly

最新推荐文章于 2024-08-17 10:50:44 发布

阅读量4.5k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/82756160

版权

本文介绍了如何利用变分自编码器(VAE)进行无监督聚类，提出了一种结合编码、聚类和生成的框架。通过在隐变量中引入离散类别变量，VAE的损失函数被改写，使得模型能够同时完成聚类和条件生成。在MNIST和Fashion-MNIST数据集上的实验展示了该方法的有效性，实现了较高的聚类准确率。

摘要由CSDN通过智能技术生成

640

作者丨苏剑林

单位丨广州火焰信息科技有限公司

研究方向丨NLP，神经网络

个人主页丨kexue.fm

由于 VAE 中既有编码器又有解码器（生成器），同时隐变量分布又被近似编码为标准正态分布，因此 VAE 既是一个生成模型，又是一个特征提取器。

在图像领域中，由于 VAE 生成的图片偏模糊，因此大家通常更关心 VAE 作为图像特征提取器的作用。提取特征都是为了下一步的任务准备的，而下一步的任务可能有很多，比如分类、聚类等。本文来关心“聚类”这个任务。

一般来说，用 AE 或者 VAE 做聚类都是分步来进行的，即先训练一个普通的 VAE，然后得到原始数据的隐变量，接着对隐变量做一个 K-Means 或 GMM 之类的。但是这样的思路的整体感显然不够，而且聚类方法的选择也让我们纠结。

本文介绍基于 VAE 的一个“一步到位”聚类思路，它同时允许我们完成无监督地完成聚类和条件生成。

理论

一般框架

回顾 VAE 的 loss（如果没印象请参考再谈变分自编码器VAE：从贝叶斯观点出发）：

640

通常来说，我们会假设 q(z) 是标准正态分布，p(z|x),q(x|z) 是条件正态分布，然后代入计算，就得到了普通的 VAE 的 loss。

然而，也没有谁规定隐变量一定是连续变量吧？这里我们就将隐变量定为 (z,y)，其中 z 是一个连续变量，代表编码向量；y 是离散的变量，代表类别。直接把 (1) 中的 z 替换为 (z,y)，就得到：

640

这就是用来做聚类的 VAE 的 loss 了。

分步假设

啥？就完事了？呃，是的，如果只考虑一般化的框架，(2) 确实就完事了。

不过落实到实践中，(2) 可以有很多不同的实践方案，这里介绍比较简单的一种。首先我们要明确，在 (2 )中，我们只知道 p̃(x)（通过一批数据给出的经验分布），其他都是没有明确下来的。于是为了求解 (2)，我们需要设定一些形式。一种选取方案为：

最低0.47元/天解锁文章

关注

2
点赞
踩
28

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。