【论文讲解】何恺明老师2024新作:无需向量量化的自回归图像生成

原文链接

Autoregressive Image Generation without Vector Quantization
Li T, Tian Y, Li H, et al. Autoregressive Image Generation without Vector Quantization[J]. arXiv preprint arXiv:2406.11838, 2024.
https://arxiv.org/abs/2406.11838
在这里插入图片描述
本博文仅在简介文章主要内容的基础上做一些讲解,文中使用“【】”括住的为非原文内容。更多细节请参考原文。原文于24年6月17日上传arXiv,作者单位包括MIT、Google Deepmind和清华大学。

摘要

原文摘要翻译

传统观点认为,自回归图像生成模型通常需要使用向量量化的token。我们观察到,虽然离散值空间可以方便地表示类别分布,但它并不是自回归建模的必要条件。在这项工作中,我们提出了一种使用扩散过程来建模每个token概率分布的方法,这使得我们可以在连续值空间中应用自回归模型。我们不再使用类别交叉熵损失,而是定义了一种“扩散损失”函数来建模每个token的概率。这种方法消除了对离散值tokenizer的需求。我们评估了其在各种场景中的有效性,包括标准的自回归模型和广义的掩码自回归(MAR)变体。通过去除向量量化,我们的图像生成器在保持序列建模速度优势的同时取得了良好

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值