什么是对抗机器学习
对抗机器学习其实有很宽泛的概念,总体可以分为两类:
- 对抗攻击学习(Adversarial Attack Learning),这里的对抗主要是研究如何让模型在有不同噪声和干扰的情况下变得更鲁棒,具体的攻击可能来源于不同的层次,如实例级别的、标签级别的、模型级别的。
- 生成对抗网络(Generative Adversarial Networks),利用生成网络和判别网络隐式的对数据分布进行拟合,达到生成数据或者学习到目标数据的分布的目的,其中生成网络G和判别网络D不断对抗博弈,最终达到一个纳什均衡的状态。针对不同的生成任务,如视频、图像翻译、文字生成、图像生成,又分成很多个小领域。
对抗机器学习的类别
Adversarial Machine Learning (AML)的研究工作简单可以分为两个部分:攻击和防御。
攻击,即指如何生成对抗样本以使得机器学习模型产生错误的预测;防御,即指如何使机器学习模型对对抗样本更鲁棒。
参考文章
对抗机器学习(Adversarial Machine Learning)发展现状
对抗机器学习(Adversarial Machine Learning)
CVPR2020 对抗学习(adversarial learning)文章汇总
bert 对抗训练实现代码
Adversarial Machine Learning (AML, 对抗机器学习)技术调研