VQ-VAE-2: Deepmind论文解读

本文深入探讨了Deepmind的VQ-VAE-2模型,该模型在生成效果上超越了BigGAN。文章介绍了模型的压缩与量化创新,以及引入的层级框架,旨在解决自回归生成模型的效率和连续潜在变量的问题。通过离散化潜在变量和分层编码,VQ-VAE-2能有效生成高质量图像,并提供了一种新的图像生成思路。
摘要由CSDN通过智能技术生成

根据科技媒体的报道,最近deepmind的新模型VQ-VAE-2的生成效果甚至超过了BigGAN,作为生成模型的初学者,我知道GAN,知道AE和VAE,但是却对这篇文章的VQ没有了解。“这会是一种新的生成模型吗”—这个问题使我想一探究竟。

效果图

容我先放几张模型生成的图片来吸引读者的阅读兴趣。你相信这些人脸只是模型臆想出来的吗,这么优美的图像细节到底是如何产生的呢
模型生成的人脸

模型架构

让我们先从一个高层的角度审视一下整个模型,我喜欢这种思维方式—从大到小的思维方式,我想这可能也比较符合中国人的思维方式。当然,这个模型里面的很多东西你可能并不懂,但是这并不影响我们建立对它的整体认知。
该篇文章的整体架构来自于第一代VQ-VAE,其架构图如下:

  • 10
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值