影像篡改与识别(三):人工智能时代

2019年,据美联社报道,一名间谍利用AI生成的个人资料和图片,在全球知名的职场社交平台LinkedIn上欺骗联系人,包括政治专家和政府内部人员[1][2]

这位30多岁的女性名叫凯蒂•琼斯,拥有一份顶级智库的工作,虽然她的关系网规模不大,只有52个联系人,但却都有着举足轻重的影响力,比如:一位副助理国务卿、一位参议员的高级助理、以及正在考虑谋求美联储一席之地的经济学家保罗•温弗里。

然而,经过许多相关人员和专家的调查采访,美联社证实了凯蒂•琼斯其实并不存在,她的人脸照片似乎是由一种典型的GAN技术生成的,这个角色只是潜伏在LinkedIn上的众多幻影资料之一,其目的极有可能是从事间谍活动。

这则报道让人们意识到,进入人工智能时代,影像篡改技术又发生了革命性的变化,而滥用这种AI伪造技术带来的安全问题更是与日俱增,甚至严重威胁到国家和社会的安定。今天我们就来说说这种神秘的GAN技术。

人工智能时代的GAN技术是指什么?

GAN,全称是生成式对抗网络Generative Adversarial Network,它是一种AI深度学习模型,而关于GAN的诞生不承想竟然是一次“酒后的意外”[3][4]

2014年,当时“GAN之父”Goodfellow还在蒙特利尔大学读博士,一天晚上他与几个朋友在一家名为“三个酿酒师”的酒吧里给师兄庆祝博士毕业。

一群技术工程师们边喝酒边聊天,聊到了如何让计算机自动生成照片这个问题。Goodfellow的朋友们提出了一个想法,将照片中的所有构成元素全部输入到计算机进行统计分析,以便让它能够自己生成照片。

然而,Goodfellow却认为这个想法是不太现实的,需要考虑的数学统计量实在太多。突然他灵光一闪:是否可以让一个神经网络来“监督指导”另一个神经网络生成照片呢?不过这个大胆的想法却让朋友们一致产生了怀疑。

酒后回到家,Goodfellow连夜编写了程序来验证这个“不切实际”的想法,谁也不会想到竟然第一次测试就取得了成功。那一夜Goodfellow难以入眠,因为他所创造出来的东西就是如今大名鼎鼎的GAN技术。

那么,GAN技术究竟是指什么呢?先举一个“印假钞者与警察”的例子[5]

  • 印假钞者通过参考真实钞票的样子来印制假钞,而警察需要辨别拿到的钞票是真是假;
  • 起初,印假钞者的能力不足,印制的假钞很容易被警察识别,所以印假钞者就不断提升自己的造假能力;
  • 同时,警察在辨别过程中也在不断积累经验,提升自己的假钞识别能力,这就形成了一个相互对抗的过程;
  • 直到最后,印假钞者可以印制出完美的假钞,而警察再也无力区分它的真假。

实际上,GAN技术的思想与这个例子是异曲同工的。

GAN本身包含两个神经网络,一个是生成器(同印假钞者)用来从一个随机噪声生成一张照片;另一个是判别器(同警察)用来辨别生成照片和真实照片的真假。下面三张图很好的诠释了GAN网络的迭代训练过程[6]

训练初期,Generator生成器造出来的图像与真实图像Real Data相差很大,Discriminator判别器很容易区分;

训练中期,Generator生成器迭代更新,已经可以造出内容接近的图像,而Discriminator判别器的识别困难度也在不断增加;

训练后期,Generator生成器已经可以造出非常逼真的图像,而Discriminator判别器再难以区分真假,只能随机猜测,即0.5概率认为是真,0.5概率认为是假。

是的,当GAN网络训练收敛后的Generator生成器,就是所谓人工智能时代的一件影像篡改利器。当然,随着前几年GAN技术的火热,许多专家和学者都投入到了GAN的技术研究上来,如今GAN家族早已是“人丁兴旺”。

影像篡改的AI工具箱

继Goodfellow以后,GAN技术并没有就此停下脚步,而是逐渐衍生出至少上百种模型,它们都可以轻易实现影像篡改处理,比如:CGAN、DCGAN、WGAN、CycleGAN、PGGAN、StarGAN、SAGAN、BigGAN、Style

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值