来源:AAS自动化学报
摘要:生成式对抗网络 (Generative adversarial networks, GAN) 是当前人工智能学界最为重要的研究热点之一. 其主要思想是设置一个零和博弈, 通过两个玩家的对抗实现学习.
博弈中的一名玩家称为生成器, 它的主要工作是生成样本, 并尽量使得其看上去与训练样本一致. 另外一名玩家称为判别器, 它的目的是准确判断输入样本是否属于真实的训练样本. 一个常见的比喻是将这两个网络想象成伪钞制造者与警察. GAN的训练过程类似于伪钞制造者尽可能提高伪钞制作水平以骗过警察, 而警察则不断提高鉴别能力以识别伪钞. 随着GAN的不断训练, 伪钞制作者与警察的能力都会不断提高.
图 1 生成式对抗网络
相比以往的生成模型, GAN模型具有以下几点明显的优势: 一是数据生成的复杂度与维度线性相关, 对于较大维度的样本生成, 仅需增加神经网络的输出维度, 不会像传统模型一样面临指数上升的计算量; 二是对数据的分布不做显性的限制, 从而避免了人工设计模型分布的需要; 三是GAN生成的手写数字, 人脸, CIFAR-10等样本较VAE, PixelCNN等生成模型更为清晰.
图 2 GAN与传统方法的数据填补效果 [3]
图 3 iGAN的生成样例 [4]
GAN突出的生成能力不仅可用于生成各类图像和自然语言数据, 还启发和推动了各类半监督学习和无监督学习任务的发展. 结合GAN, 研究者在数据填报, 图像翻译, 数据合成, 模仿学习等诸多方面取得了突破性的进展.
图 4 图对图翻译 [5]
图 5 使用GAN合成数据训练机械臂 [6]
然而, 原始GAN模型也存在许多问题, 包括收敛困难, 无法生成离散数据, 难以评价等. 本文对GAN近年来的发展进行了综述, 对GAN在生成机制, 判别机制两方面的改进进行了介绍, 并梳理了其应用领域. 在此基础上, 本文还探讨了GAN与平行思想的关系.
图 6 本文组织结构
林懿伦, 戴星原, 李力, 王晓, 王飞跃. 人工智能研究的新前线:生成式对抗网络. 自动化学报, 2018, 44(5): 775-792.
参考文献
[1] I. Goodfellow et al., “Generative adversarial nets,” in Advances in neural information processing systems, 2014, pp. 2672–2680
[2] I. Goodfellow, “NIPS 2016 Tutorial: Generative Adversarial Networks,” arXiv:1701.00160 [cs], Dec. 2016(arXiv: 1701.00160)
[3] S. Iizuka, E. Simo-Serra, and H. Ishikawa, “Globally and locally consistent image completion,” ACM Transactions on Graphics, vol. 36, no. 4, pp. 1–14, Jul. 2017
[4] J.-Y. Zhu, P. Krähenbühl, E. Shechtman, and A. A. Efros, “Generative Visual Manipulation on the Natural Image Manifold,” in European Conference on Computer Vision, 2016, pp. 597–613
[5] P. Isola, J.-Y. Zhu, T. Zhou, and A. A. Efros, “Image-to-image translation with conditional adversarial networks,” arXiv preprint arXiv:1611.07004, 2016
[6] K. Bousmalis et al., “Using Simulation and Domain Adaptation to Improve Efficiency of Deep Robotic Grasping,” arXiv:1709.07857 [cs], Sep. 2017(arXiv: 1709.07857)
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”