对抗攻击相关概念

最新推荐文章于 2024-04-09 14:52:14 发布

love the future

最新推荐文章于 2024-04-09 14:52:14 发布

阅读量960

点赞数 1

分类专栏：深度学习文章标签：图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43328816/article/details/122474561

版权

深度学习专栏收录该内容

8 篇文章 1 订阅

订阅专栏

1.相关的概念

对抗样本

要认识对抗训练，首先要了解“对抗样本”，它首先出现在论文 Intriguing properties of neural networks [3] 之中。在该论文中也提出了一种对抗样本产生的方法L-BFGS。

简单来说，它是指对于人类来说“看起来”几乎一样、但对于模型来说预测结果却完全不一样的样本

对抗攻击和对抗防御

理解对抗样本之后，也就不难理解各种相关概念了，比如“对抗攻击”，其实就是想办法造出更多的对抗样本，而“对抗防御”，就是想办法让模型能正确识别更多的对抗样本。

对抗训练

所谓对抗训练，则是属于对抗防御的一种，它构造了一些对抗样本加入到原数据集中，希望增强模型对对抗样本的鲁棒性；同时，如本文开篇所提到的，在 NLP 中它通常还能提高模型的表现。

2.对抗训练的理解

Min Max

对抗训练一般可以写为：

D代表训练集，x代表输入，y代表标签， $\theta$ 是模型参数，L是单个样本的 loss， $\Delta x$ 是对抗扰动， $\Omega$ 是扰动空间。这个统一的格式首先由论文 Towards Deep Learning Models Resistant to Adversarial Attacks [4] 提出。

3.快速梯度法产生对抗样本

快速梯度法是由 GAN 之父 Goodfellow 在论文 Explaining and Harnessing Adversarial Examples首先提出。

生成对抗样本的问题就是我们怎么生成扰动 $\Delta x$ ， $\Delta x$ 存在的目的就是增加

我们知道让 loss 减少的方法是梯度下降，那反过来，让 loss 增大的方法自然就是梯度上升，因此可以简单地取：

为了防止 $\Delta x$ 过大，我们一般需要对进行一些标准化，比较常见的方式是：

有了扰动 $\Delta x$ 之后，就可以代回式 (1) 进行优化：

此外，对抗训练还有一种方法，叫做 Projected Gradient Descent（PGD），其实就是通过多迭代几步来达到让更大的更大的 $\Delta x$ 。

如果迭代过程中模长超过了 $\epsilon$ ，就缩放回去，细节请参考Towards Deep Learning Models Resistant to Adversarial Attacks 。

love the future

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
对抗攻击相关概念

1.相关的概念对抗样本要认识对抗训练，首先要了解“对抗样本”，它首先出现在论文 Intriguing properties of neural networks [3] 之中。在该论文中也提出了一种对抗样本产生的方法L-BFGS。简单来说，它是指对于人类来说“看起来”几乎一样、但对于模型来说预测结果却完全不一样的样本对抗攻击和对抗防御理解对抗样本之后，也就不难理解各种相关概念了，比如“对抗攻击”，其实就是想办法造出更多的对抗样本，而“对抗防御”，就是想办法让模型能正确识别更多的对抗样本。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。