变分自编码器VAE:一步到位的聚类方案

640


作者丨苏剑林

单位丨广州火焰信息科技有限公司

研究方向丨NLP,神经网络

个人主页丨kexue.fm


由于 VAE 中既有编码器又有解码器(生成器),同时隐变量分布又被近似编码为标准正态分布,因此 VAE 既是一个生成模型,又是一个特征提取器。


在图像领域中,由于 VAE 生成的图片偏模糊,因此大家通常更关心 VAE 作为图像特征提取器的作用。提取特征都是为了下一步的任务准备的,而下一步的任务可能有很多,比如分类、聚类等。本文来关心“聚类”这个任务。


一般来说,用 AE 或者 VAE 做聚类都是分步来进行的,即先训练一个普通的 VAE,然后得到原始数据的隐变量,接着对隐变量做一个 K-Means 或 GMM 之类的。但是这样的思路的整体感显然不够,而且聚类方法的选择也让我们纠结。


本文介绍基于 VAE 的一个“一步到位”聚类思路,它同时允许我们完成无监督地完成聚类和条件生成。


理论


一般框架


回顾 VAE 的 loss(如果没印象请参考再谈变分自编码器VAE:从贝叶斯观点出发):


640


通常来说,我们会假设 q(z) 是标准正态分布,p(z|x),q(x|z) 是条件正态分布,然后代入计算,就得到了普通的 VAE 的 loss。


然而,也没有谁规定隐变量一定是连续变量吧?这里我们就将隐变量定为 (z,y),其中 z 是一个连续变量,代表编码向量;y 是离散的变量,代表类别。直接把 (1) 中的 z 替换为 (z,y),就得到:


640


这就是用来做聚类的 VAE 的 loss 了。


分步假设


啥?就完事了?呃,是的,如果只考虑一般化的框架,(2) 确实就完事了。 


不过落实到实践中,(2) 可以有很多不同的实践方案,这里介绍比较简单的一种。首先我们要明确,在 (2 )中,我们只知道 p̃(x)(通过一批数据给出的经验分布),其他都是没有明确下来的。于是为了求解 (2),我们需要设定一些形式。一种选取方案为:

  • 2
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
变分自编码器(Variational Autoencoder,VAE)是一种生成模型,结合了自动编码器和概率推断的思想。它通过学习数据的潜在分布来实现数据的压缩和生成。在聚类任务中,VAE可以用于学习数据的低维表示,并将相似的样本聚集在一起。 在MATLAB中,可以使用编码器网络和解码器网络来构建一个变分自编码器。编码器网络将输入图像映射到潜在空间的均值和方差矩阵,而解码器网络则将潜在变量映射回原始图像空间。通过最小化重构误差和潜在空间的正则化项,可以训练VAE模型。 为了在聚类任务中可视化潜在空间,可以使用PCA(主成分分析)将潜在变量降维到二维,并将其绘制在散点图上。不同类别的样本可以使用不同的颜色进行标记,以便观察聚类效果。 以下是一个MATLAB函数的示例代码,用于实现变分自编码器聚类: ```matlab function visualizeLatentSpace(XTest, YTest, encoderNet) \[~, zMean, zLogvar\] = sampling(encoderNet, XTest); zMean = stripdims(zMean)'; zMean = gather(extractdata(zMean)); zLogvar = stripdims(zLogvar)'; zLogvar = gather(extractdata(zLogvar)); \[~,scoreMean\] = pca(zMean); \[~,scoreLogvar\] = pca(zLogvar); c = parula(10); f1 = figure; figure(f1) title("Latent space") ah = subplot(1,2,1); scatter(scoreMean(:,2),scoreMean(:,1),\[\],c(double(YTest),:)); ah.YDir = 'reverse'; axis equal xlabel("Z_m_u(2)") ylabel("Z_m_u(1)") cb = colorbar; cb.Ticks = 0:(1/9):1; cb.TickLabels = string(0:9); ah = subplot(1,2,2); scatter(scoreLogvar(:,2),scoreLogvar(:,1),\[\],c(double(YTest),:)); ah.YDir = 'reverse'; xlabel("Z_v_a_r(2)") ylabel("Z_v_a_r(1)") cb = colorbar; cb.Ticks = 0:(1/9):1; cb.TickLabels = string(0:9); axis equal end ``` 这个函数接受测试数据集XTest和对应的标签YTest,以及已经训练好的编码器网络encoderNet作为输入。它首先从编码器网络中提取均值和方差矩阵,然后使用PCA将潜在变量降维到二维。最后,它将降维后的潜在变量绘制在散点图上,并使用不同的颜色标记不同的类别。 希望这个回答对你有帮助! #### 引用[.reference_title] - *1* *2* [MATLAB实现自编码器(五)——变分自编码器VAE)实现图像生成的帮助函数](https://blog.csdn.net/qq_36108664/article/details/107897752)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [MATLAB实现自编码器(四)——变分自编码器实现图像生成Train Variational Autoencoder (VAE) to Generate ...](https://blog.csdn.net/qq_36108664/article/details/107850034)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值