用于高保真自然图像合成的大规模GAN训练（Large Scale GAN Training For High Fidelity Natural Images）论文 pdf

最新推荐文章于 2024-10-28 10:22:26 发布

转载最新推荐文章于 2024-10-28 10:22:26 发布 · 504 阅读

文章标签：

#用于高保真自然图像合成的大规模GAN训练 #Large Scale GAN Training For H #Large Scale GAN Training For H #Large Scale GAN Training For H #机器学习论文

深度学习&机器学习专栏收录该内容

5 篇文章

订阅专栏

本文围绕大规模GAN训练用于高保真自然图像合成展开。研究在最大规模下训练生成对抗网络，发现正交正则化结合“截断技巧”可控制样本保真度和多样性权衡。BigGAN在ImageNet上训练取得新成果，还探讨了未来研究方向和可能应用。

下载地址：https://u20150046.ctfile.com/fs/20150046-376632643

By Andrew Brock，Jeff Donahue，Karen Simonyan（2018）

论文摘要

尽管生成图像建模最近取得了进展，但从ImageNet等复杂数据集成功生成高分辨率、多样化的样本仍然是一个难以实现的目标。为此，我们在最大的规模下进行了生成对抗网络的训练，并研究了这种规模下的不稳定性。我们发现，将正交正则化应用于发生器，使其服从于一个简单的“截断技巧”，可以允许通过截断潜在空间来精细控制样本保真度和多样性之间的权衡。我们的修改使得模型在类条件图像合成中达到了新的技术水平。当我们在ImageNet上以128×128分辨率进行训练时，我们的模型（BigGAN）的初始得分（IS）为166.3，Frechet初始距离（FID）为9.6。

概览

DeepMind团队发现，当前的技术足以从现有数据集(如ImageNet和JFT-300M)合成高分辨率、多样化的图像。他们特别指出，生成对抗网络(GANs)可以生成看起来非常逼真的图像，如果它们在非常大的范围内进行训练，即使用比以前实验多2到4倍的参数和8倍的批处理大小。这些大规模的GAN，或BigGAN，是类条件图像合成的最新技术。