RSGAN：对抗模型中的“图灵测试”思想

最新推荐文章于 2023-07-21 11:29:07 发布

PaperWeekly

最新推荐文章于 2023-07-21 11:29:07 发布

阅读量1.8k

点赞数

本文链接：https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/83507474

版权

RSGAN（相对GAN）通过引入“图灵测试”思想，改进了标准GAN的判别器，使得生成器训练更快且更稳定。RSGAN的判别器比较真假样本的相对价值，而不是孤立地评估，这反映了在对比中区分真伪的思想。文章探讨了RSGAN模型的优化目标和理论结果，指出其在某些任务上能提升生成质量并加速生成器训练。

摘要由CSDN通过智能技术生成

640

作者丨苏剑林

单位丨广州火焰信息科技有限公司

研究方向丨NLP，神经网络

个人主页丨kexue.fm

这两天无意间发现一个非常有意义的工作，称为“相对GAN”，简称 RSGAN，来自文章 The relativistic discriminator: a key element missing from standard GAN，据说该文章还得到了 GAN 创始人 Goodfellow 的点赞。这篇文章提出了用相对的判别器来取代标准 GAN 原有的判别器，使得生成器的收敛更为迅速，训练更为稳定。

640

可惜的是，这篇文章仅仅从训练和实验角度对结果进行了论述，并没有进行更深入的分析，以至于不少人觉得这只是 GAN 训练的一个 trick。但是在笔者看来，RSGAN 具有更为深刻的含义，甚至可以看成它已经开创了一个新的 GAN 流派。所以，笔者决定对 RSGAN 模型及其背后的内涵做一个基本的介绍。不过需要指出的是，除了结果一样之外，本文的介绍过程跟原论文相比几乎没有重合之处。

“图灵测试”思想

SGAN

SGAN 就是标准的 GAN（Standard GAN）。就算没有做过 GAN 研究的读者，相信也从各种渠道了解到 GAN 的大概原理：“造假者”不断地进行造假，试图愚弄“鉴别者”；“鉴别者”不断提高鉴别技术，以分辨出真品和赝品。两者相互竞争，共同进步，直到“鉴别者”无法分辨出真、赝品了，“造假者”就功成身退了。

在建模时，通过交替训练实现这个过程：固定生成器，训练一个判别器（二分类模型），将真实样本输出 1，将伪造样本输出 0；然后固定判别器，训练生成器让伪造样本尽可能输出 1，后面这一步不需要真实样本参与。

问题所在

然而，这个建模过程似乎对判别器的要求过于苛刻了，因为判别器是孤立运作的：训练生成器时，真实样本没有参与，所以判别器必须把关于真实样本的所有属性记住，这样才能指导生成器生成更真实的样本。

在生活实际中，我们并不是这样做的，所谓“没有对比就没有伤害，没有伤害就没有进步”，我们很多时候是根据真、赝品的对比来分辨的。比如识别一张假币，可能需要把它跟一张真币对比一下；识别山寨手机，只需要将它跟正版手机对比一下就行了；等等。类似地，如果要想把赝品造得更真，那么需要把真品放在一旁不断地进行对比改进，而不是单单凭借“记忆”中的真品来改进。

“对比”能让我们更容易识别出真、赝品出来，从而更好地制造赝品。而在人工智能领域，我们知道有非常著名的“图灵测试”，指的是测试者在无法预知的情况下同时跟机器人和人进行交流，如果测试者无法成功分别出人和机器人，那么说明这个机器人已经（在某个方面）具有人的智能了。“图灵测试”也强调了对比的重要性，如果机器人和人混合起来后就无法分辨了，那么说明机器人已经成功了。

接下来我们将会看到，RSGAN 就是基于“图灵测试”的思想的：如果鉴别器无法鉴别出混合的真假图片，那么生成器就成功了；而为了生成更好的图片，生成器也需要直接借助于真实图片。