影像篡改与识别（三）：人工智能时代

云鼎实验室

于 2021-09-15 17:49:40 发布

阅读量582

点赞数 1

分类专栏：资讯文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/YDclub/article/details/120313755

版权

2019年，据美联社报道，一名间谍利用AI生成的个人资料和图片，在全球知名的职场社交平台LinkedIn上欺骗联系人，包括政治专家和政府内部人员[1][2]。

这位30多岁的女性名叫凯蒂•琼斯，拥有一份顶级智库的工作，虽然她的关系网规模不大，只有52个联系人，但却都有着举足轻重的影响力，比如：一位副助理国务卿、一位参议员的高级助理、以及正在考虑谋求美联储一席之地的经济学家保罗•温弗里。

然而，经过许多相关人员和专家的调查采访，美联社证实了凯蒂•琼斯其实并不存在，她的人脸照片似乎是由一种典型的GAN技术生成的，这个角色只是潜伏在LinkedIn上的众多幻影资料之一，其目的极有可能是从事间谍活动。

这则报道让人们意识到，进入人工智能时代，影像篡改技术又发生了革命性的变化，而滥用这种AI伪造技术带来的安全问题更是与日俱增，甚至严重威胁到国家和社会的安定。今天我们就来说说这种神秘的GAN技术。

人工智能时代的GAN技术是指什么？

GAN，全称是生成式对抗网络Generative Adversarial Network，它是一种AI深度学习模型，而关于GAN的诞生不承想竟然是一次“酒后的意外”[3][4]？

2014年，当时“GAN之父”Goodfellow还在蒙特利尔大学读博士，一天晚上他与几个朋友在一家名为“三个酿酒师”的酒吧里给师兄庆祝博士毕业。

一群技术工程师们边喝酒边聊天，聊到了如何让计算机自动生成照片这个问题。Goodfellow的朋友们提出了一个想法，将照片中的所有构成元素全部输入到计算机进行统计分析，以便让它能够自己生成照片。

然而，Goodfellow却认为这个想法是不太现实的，需要考虑的数学统计量实在太多。突然他灵光一闪：是否可以让一个神经网络来“监督指导”另一个神经网络生成照片呢？不过这个大胆的想法却让朋友们一致产生了怀疑。

酒后回到家，Goodfellow连夜编写了程序来验证这个“不切实际”的想法，谁也不会想到竟然第一次测试就取得了成功。那一夜Goodfellow难以入眠，因为他所创造出来的东西就是如今大名鼎鼎的GAN技术。

那么，GAN技术究竟是指什么呢？先举一个“印假钞者与警察”的例子[5]：

实际上，GAN技术的思想与这个例子是异曲同工的。

GAN本身包含两个神经网络，一个是生成器（同印假钞者）用来从一个随机噪声生成一张照片；另一个是判别器（同警察）用来辨别生成照片和真实照片的真假。下面三张图很好的诠释了GAN网络的迭代训练过程[6]：

训练初期，Generator生成器造出来的图像与真实图像Real Data相差很大，Discriminator判别器很容易区分；

训练中期，Generator生成器迭代更新，已经可以造出内容接近的图像，而Discriminator判别器的识别困难度也在不断增加；

训练后期，Generator生成器已经可以造出非常逼真的图像，而Discriminator判别器再难以区分真假，只能随机猜测，即0.5概率认为是真，0.5概率认为是假。

是的，当GAN网络训练收敛后的Generator生成器，就是所谓人工智能时代的一件影像篡改利器。当然，随着前几年GAN技术的火热，许多专家和学者都投入到了GAN的技术研究上来，如今GAN家族早已是“人丁兴旺”。

继Goodfellow以后，GAN技术并没有就此停下脚步，而是逐渐衍生出至少上百种模型，它们都可以轻易实现影像篡改处理，比如：CGAN、DCGAN、WGAN、CycleGAN、PGGAN、StarGAN、SAGAN、BigGAN、Style

关注

专栏目录