VQ-VAE-2: Deepmind论文解读

最新推荐文章于 2024-07-30 15:47:37 发布

鲜-橙

最新推荐文章于 2024-07-30 15:47:37 发布

阅读量3.3k

点赞数 10

分类专栏：计算机视觉文章标签：生成模型人工智能计算机视觉 VAE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30172585/article/details/96142587

版权

本文深入探讨了Deepmind的VQ-VAE-2模型，该模型在生成效果上超越了BigGAN。文章介绍了模型的压缩与量化创新，以及引入的层级框架，旨在解决自回归生成模型的效率和连续潜在变量的问题。通过离散化潜在变量和分层编码，VQ-VAE-2能有效生成高质量图像，并提供了一种新的图像生成思路。

摘要由CSDN通过智能技术生成

根据科技媒体的报道，最近deepmind的新模型VQ-VAE-2的生成效果甚至超过了BigGAN，作为生成模型的初学者，我知道GAN，知道AE和VAE，但是却对这篇文章的VQ没有了解。“这会是一种新的生成模型吗”—这个问题使我想一探究竟。

效果图

容我先放几张模型生成的图片来吸引读者的阅读兴趣。你相信这些人脸只是模型臆想出来的吗，这么优美的图像细节到底是如何产生的呢
模型生成的人脸

模型架构

让我们先从一个高层的角度审视一下整个模型，我喜欢这种思维方式—从大到小的思维方式，我想这可能也比较符合中国人的思维方式。当然，这个模型里面的很多东西你可能并不懂，但是这并不影响我们建立对它的整体认知。
该篇文章的整体架构来自于第一代VQ-VAE，其架构图如下：

最低0.47元/天解锁文章

关注

10
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
VQ-VAE-2: Deepmind论文解读

根据科技媒体的报道，最近deepmind的新模型VQ-VAE-2的生成效果甚至超过了BigGAN，作为生成模型的初学者，我知道GAN，知道AE和VAE，但是却对这篇文章的VQ没有了解。“这会是一种新的生成模型吗”—这个问题使我想一探究竟。效果图容我先放几张模型生成的图片来吸引读者的阅读兴趣。你相信这些人脸只是模型臆想出来的吗，这么优美的图像细节到底是如何产生的呢模型架构让我们先从一个高层...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。