GAN
文章平均质量分 82
AI强仔
人工智能爱好者、机器人爱好者
展开
-
VQGAN图像生成(离散化加对抗训练)
我们显示了1)如何使用CNN学习了一个图像成分的语义丰富的词汇表,这部分也就是VQGAN;2)利用transformer在高分辨率图像中有效地对其组成(VQGAN压缩过的图片码书表示)进行建模。整体模型也就如下图,包括两部分,VQGAN和transformer。VQGAN先进行图片的压缩,然后输入到transformer。翻译 2023-06-19 16:18:12 · 1505 阅读 · 0 评论 -
Muse:采用mask transformer的图像生成模型
本文根据google research 团队2023年1月的《Muse: Text-To-Image Generation via Masked Generative Transformers 》翻译总结的。图像生成有GAN、扩散(diffusion)、自回归模型等,而Muse采用mask图像的建模方法,非扩散、非自回归。给定从预训练大预言模型(LLM)中提取的文本embedding,Muse是被训练来预测随机mask的图像token。翻译 2023-06-09 17:21:05 · 1462 阅读 · 0 评论 -
DALL·E 2 :OpenAI第二代文本生成图片模型(unCLIP--基于CLIP的文本生成图像模型)
《Hierarchical Text-Conditional Image Generation with CLIP Latents》翻译总结的。如题,基于CLIP进行图片生成翻译 2022-09-22 23:01:56 · 4092 阅读 · 0 评论 -
各种生成模型:VAE、GAN、flow、DDPM、autoregressive models
各种生成模型:VAE、GAN、flow、DDPM、autoregressive models原创 2022-08-29 17:12:37 · 25281 阅读 · 1 评论 -
流模型(flow)--《NICE: Non-linear Independent Components Estimation》
本文根据2015年《NICE: Non-linear Independent Components Estimation》翻译总结的。流模型的最初论文。流模型(flow)也是一种生成模型。翻译 2022-08-28 22:17:47 · 2353 阅读 · 0 评论 -
DDPM--Denoising Diffusion Probabilistic Models
本文根据2020年《Denoising Diffusion Probabilistic Models》翻译总结的,即DDPM,去噪扩散概率模型。翻译 2022-08-21 20:59:40 · 1943 阅读 · 0 评论 -
VAE、AEVB、SGVB——Auto-Encoding Variational Bayes
AEVB、SGVB翻译 2022-08-10 09:38:24 · 1692 阅读 · 0 评论 -
生成式对抗网络GAN(Generative Adversarial Nets)论文笔记
1.介绍本文基本从《Generative Adversarial Nets》翻译总结的。GAN(Generative Adversarial Nets),生成式对抗网络。包含两个模型,一个生成模型G,用来捕捉数据分布,一个识别模型D,用来评估采样是来自于训练数据而不是G的可能性。这两个模型G与D是竞争关系、敌对关系。比如生成模型G就像是在制造假的货币,而识别模型D就像是警察,尝试检测这些假币......原创 2020-03-22 22:42:41 · 2047 阅读 · 0 评论