初探对抗攻击——黑盒攻击&白盒攻击

最新推荐文章于 2024-01-03 21:21:03 发布

Wwwwhy_　

最新推荐文章于 2024-01-03 21:21:03 发布

阅读量1.4w

点赞数 10

分类专栏：图像识别系统对抗文章标签：深度学习人工智能机器学习白箱测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WangHY_XCJ/article/details/109212744

版权

图像识别系统对抗专栏收录该内容

12 篇文章

订阅专栏

对抗攻击是针对深度学习模型的一种策略，通过微小扰动使模型分类错误。主要分为白盒攻击和黑盒攻击。白盒攻击中，攻击者拥有模型的全部信息，利用梯度进行精确调整；而黑盒攻击则限制了攻击者只能通过模型的输入输出交互，如one-pixel-attack，随机修改像素进行攻击。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

对抗攻击
- 1. 白盒攻击
- 2. 黑盒攻击

对抗攻击

对抗攻击概念：

通过对输入添加微小的扰动使得分类器分类错误，一般用于对深度学习的网络的攻击算法最为常见，应用场景包括目前大热的CV和NLP方向，例如、通过对图片添加精心准备的扰动噪声使得分类错误，或者通过对一个句子的某些词进行同义词替换使得情感分类错误。
关于攻击的类型有很多种，从攻击环境来说，可以分为黑盒攻击、白盒攻击或者灰盒攻击：

1. 白盒攻击

假设我们图像的数组为x，模型已经正确分类到y_true，这时我们需要进行白盒攻击，微小地修改图像数组x使得模型将其分类到y1
给模型输入（x，y1）获取到模型在输入x上的梯度，这里的x便是图像的数组表示
依据梯度，在图像上进行调整，以达到减小误差，判断是否此时模型将其分类到y1
重复2、3步，直到模型将其分类到y1或者超出时间限制

攻击者对模型一切都可以掌握。目前大多数攻击算法都是白盒攻击。

2. 黑盒攻击

攻击者对攻击的模型的内部结构，训练参数，防御方法（如果加入了防御手段的话）等等一无所知，只能通过输出输出与模型进行交互。

黑盒攻击与白盒不同地便是，第二步，无法得到梯度，只能随机地调整图像，直到模型将其分类到y1或者超出时间限制
使用的算法是one-pixel-attack，通过随机得修改若干个像素点，进行攻击。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。