什么是对抗训练
对抗训练首先出现在图像领域。一张图片,添加一些扰动后,人眼看过去,图像是没有变化的,但是图像分来器会错误识别图像的类别。所以这里就有了对抗样本的概念,能欺骗模型的样本被称为对抗样本。在很多文章中,这个扰动被认为是微小扰动,但我觉得微小扰动是个很狭隘的概念里得出来的结论。因为早期对抗训练的研究都集中于图像领域,向图像中加入小的扰动才能让人类察觉不出来图像有变化。如果脱离图像的领域,或者我们以一个更广的视角看这个问题,就会觉得微小的扰动这个概念有些狭隘。对抗训练的本质是要让模型将人类可以分类正确的图像(或者文本之类的其他输入)也能正确分类。那么我们定义对抗样本的时候,就不用局限于小的扰动,如果大的扰动加进去,和小的扰动加进去,效果一样,那么添加了大扰动的样本也可以被称为对抗样本。所以,对抗样本可以这样定义,添加了可以欺骗模型,但不能欺骗人类的扰动的样本叫做对抗样本。