《DaST: Data-free Substitute Training for Adversarial Attacks》
作者单位:电子科技大学、旷视科技成都研究院
收录时间:2020 CVPR
文章亮点:首个无需真实数据的黑盒攻击模型
Motivation:
- 文章利用对抗生成网络(GANs)生成的合成样本去训练替身模型,然而传统的GAN在没有真实数据的情况下,生成的样本分布可能及其不均,且只包含一部分类别,这意味着替身模型将不能充分的学习到目标模型的分类特性。因此文章为生成模型设计了一个多分支架构和一个控制标签的损失函数,以解决合成样本分布不均的问题。
- 无需真实的数据,即可以生成攻击效果不错的对抗样本,在真实数据很难获取的现实情况中,此方法更具有其独特的价值。
Problem:在现实生活中,黑盒攻击比白盒攻击更为实用,但是难度更大。
- score-based attacks和 decision-based attacks 攻击是直接使用分类概率或目标模型返回的标签。这种方法虽然不需要模型,但是需要大量的查询。
- gradient-based attacks需要了解目标模型的架构和权重。
- substitute attacks不需要大量的查询,但是需要很多目标模型的真实数据来训练替身