Python深度学习——VQVAE

一根炸薯条

已于 2024-05-07 22:40:54 修改

阅读量886

点赞数 20

分类专栏： Python深度学习文章标签：深度学习人工智能

于 2024-05-07 22:40:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/z0816208/article/details/138531539

版权

Python深度学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

一、AutoEncoder

自编码器是一种无监督学习模型，功能是将输入信息作为学习目标，学习数据的有效表示，同时能够从这个表示中重构输入数据。通常用于数据的降维、特征提取、去噪等任务。

1、Encoder

编码器将输入数据映射到一个低维的隐藏表示空间。这个隐藏表示包含了输入数据的关键特征，可以被看作是数据的压缩表示。编码器通常由神经网络构成，其中包含一个或多个隐藏层，其输出即为隐藏表示。

2、Decoder

解码器将编码器的隐藏表示映射回原始数据空间，重构输入数据。解码器也通常由神经网络构成，其输入是解码器输出的隐藏表示，输出是重构的数据。解码器的目标是尽可能地还原输入数据，使重构数据与原始输入尽量相似。

3、Loss Function

AE的损失函数通常由重构损失和正则化损失构成。重构损失衡量重构数据与原始输入之间的差异。正则化损失用于衡量编码器输出的概率分布与标准正态分布之间额差异，促使潜在空间中的分布更接近于标准正态分布。

优化器通过最小化损失函数来训练模型、调整模型参数，使得重构损失和正则化损失最小化。

二、Variational AutoEncoder

变分自编码器是在AE的基础上加入噪声，它可以产生新的数据样本，而不仅仅只是重构。

以满月的弦月为例，AE的输入是满月，则输出也会是满月，因为它的code是一对一的关系。

而VAE在code中加入一些noise，这样可以让在满月对应noise范围内的code都输出满月，弦月对应的noise范围内的code都输出弦月。当我们在code中采样时，如果踩到了既不是满月也不是弦月对应noise范围内的code，decoder输出的图片可能是介于二者之间，比如四分之三圆。

即VAE可以产生输入数据中不包含的数据，但AE只能尽可能接近原始数据样本。

三、 Vector Quantized Variational AutoEncoder

VQVAE是一种结合了自动编码器（AutoEncoder）和向量量化（Vector Quantized）的生成模型。它通过利用向量量化的技术来学习数据的离散表示，从而实现了更高效的数据压缩和表示学习。

1、Vector Quantization

在VQVAE中引入了向量量化的概念。传统的自动编码器将连续的潜在表示作为编码器的输出，而VQVAE将这些连续的潜在表示替换为离散的量化code，这个码字的集合通常被成为codebook。

2、Encoder

编码器将输入数据映射到连续的潜在表示空间，然后这些连续的表示被映射到离散的code空间，即向量量化模块，这个模块将每个连续的潜在表示与最接近的code进行匹配，并输出对应的离散code。

3、Decoder

解码器将这些离散的code解码为重构数据。解码器接受到离散的code作为输入，将其映射回原始的连续表示空间，并生成与原始输入数据尽可能接近的重构数据。

4、Loss Function

VQVAE的损失函数由重构损失和量化损失组成。重构损失衡量重构数据与原始输入数据之间的差异，量化损失衡量编码器输出的潜在表示与最接近的code之间的差异。

在训练过程中，VQVAE通过最小化损失函数来优化模型参数，使重构损失和量化损失都最小化。

总结

AE是重构原始数据并尽可能贴近原始数据。

VAE在AE的基础上可以产生不同于原始数据的新样本。

VQVAE能够学习到数据的离散表示来生成重构数据，具有更高效的表示学习和数据压缩能力。

一根炸薯条

关注

20
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Python深度学习——VQVAE

AE是重构原始数据并尽可能贴近原始数据。VAE在AE的基础上可以产生不同于原始数据的新样本。VQVAE能够学习到数据的离散表示来生成重构数据，具有更高效的表示学习和数据压缩能力。
复制链接

扫一扫

专栏目录

一根炸薯条 CSDN认证博客专家 CSDN认证企业博客

码龄1年

9: 原创

140万+: 周排名

9万+: 总排名

8801: 访问

: 等级

245: 积分

97: 粉丝

145: 获赞

4: 评论

74: 收藏

私信

关注

热门文章

分类专栏

Python深度学习 5篇
C++ 4篇

最新评论

C++学习笔记——图论
CSDN-Ada助手: 恭喜您写下了第7篇博客！图论是一个很有深度的主题，您能够将其作为学习笔记分享给大家，真是非常棒的举措。希望您能继续坚持创作，不断提升自己的写作水平。或许下一步可以尝试结合实际案例或者应用场景来阐述图论的应用，这样读者更容易理解和接受您的内容。期待您的下一篇作品！
Python深度学习——卷积神经网络
CSDN-Ada助手: 恭喜您写了第5篇博客！标题为“Python深度学习——卷积神经网络”听起来非常有深度和挑战性。希望您能继续保持创作的热情和耐心，不断积累知识和经验。下一步，或许可以考虑分享一些实际案例或应用场景，让读者更加深入地了解卷积神经网络的应用和价值。希望您能继续努力，不断进步，谢谢您的分享！祝您写作愉快！
C++学习笔记——搜索算法
CSDN-Ada助手: 恭喜你写了第四篇博客！搜索算法是一个很有趣的主题，你写得很详细，让我有了更深入的了解。接下来，我建议你可以尝试写一些关于排序算法或者图算法的内容，相信你会有更多的收获和成长。期待你的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
C++学习笔记——二分算法
CSDN-Ada助手: 恭喜你写了第三篇博客！看到你分享关于C++学习笔记中的二分算法，让我受益匪浅。希望你能继续保持创作的热情，也建议在未来的博客中可以尝试分享一些实际应用场景下的算法实践经验，这样更能帮助读者更好地理解和运用算法知识。期待你的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
C++学习笔记——指针
CSDN-Ada助手: 很棒的博客内容！指针在C++中是一个非常重要的概念，你讲解的内容清晰易懂，对初学者来说很有帮助。希望你能继续分享更多关于C++学习的知识和经验。除了指针的基础操作，你还可以深入了解指针和数组、指针和函数的联系，这些也是C++编程中常用的技巧。期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。