Abstract
本文介绍了一种改进的图像合成生成对抗网络训练方法。我们利用标签条件作用构建了一个GANs变体,得到了具有全局一致性的128128分辨率的图像样本。我们在先前图像质量评估工作的基础上,提供了两种新的分析方法来评估类条件图像合成模型样本的可辨性和多样性。这些分析表明,高分辨率样本提供了在低分辨率样本中不存在的类信息。在1000个ImageNet类中,128128的样本的鉴别能力是人工调整大小的32*32个样本的两倍多。此外,84.7%的类具有与实际ImageNet数据相当的多样性。
1. Introduction
表征自然图像的结构一直是一个丰富的研究课题。自然图像遵循固有的不变性,并表现出多尺度的统计结构,这在历史上是很难量化的(Simoncelli &Olshausen, 2001)。机器学习的最新进展为大幅提高图像模型的质量提供了机会。改进的图像模型提高了图像去噪(Ball e et al., 2015)、压缩(Toderici et al., 2016)、画图(van den Oord et al., 2016)和超分辨率(Ledig et al., 2016)的技术水平。更好的自然图像模型也可以提高半监督学习任务的性能(Kingma et al., 2014;Springenberg, 2015;Odena, 2016;Salimans et al., 2016)和强化学习问题(Blundell et al., 2016)。
理解自然图像统计的一种方法是建立一个从头合成图像的系统。建立图像合成模型有几种很有前途的方法。变分自编码器(VAEs)最大化了训练数据的对数可能性的变分下界(Kingma &威林,2013;Rezende等,2014)。VAEs很容易训练,但引入了关于近似后验分布的潜在限制性假设(参见Reze