论文那些事—Black-box Adversarial Attacks with Limited Queries and Information

凉茶i

于 2021-11-10 16:55:36 发布

阅读量1.1k

点赞数 2

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shuweishuwei/article/details/121203878

版权

Black-box Adversarial Attacks with Limited Queries and Information（ICML2018）

1、摘要

黑盒模型是指只能获得它的输入输出，但在真实世界中，黑盒模型往往连输入输出都有一定限制，比如限制查询次数，当过度频繁访问一个模型，模型有可能自锁不允许访问，针对现实世界的黑盒模型，作者提出三个真实的威胁模型：查询量有限、部分信息设置和仅标签有限。针对这三个问题，作者提出了一种新的黑盒攻击方法。本文受自然进化策略（NES）的启发，提出使用NES作为黑盒梯度估计技术，并使用带有估计梯度的PGD（用于白盒攻击）构造对抗样本。想看懂这篇文章可以先去看ZOO和有限差分方法。

2、三种威胁模型的攻击方法

黑盒攻击面临的三个约束：

Query-limited setting：攻击者对分类器具有有限的查询结果，对查询数量的限制可能是对其他资源的限制的结果，例如，时间限制和金钱限制。
Partial-information setting：如何保证生成的目标类在属于top-k类，攻击者只能访问标签 y 在 top k 类标签 y 1 , y 2 , . . . , y k的概率 p ( y ∣ x ) 。
Label-only setting ：只知道top-k 中有啥类别，不知道类别的score 如何确定每个类别的score在只使用标签的设置中，敌手不能访问类的概率或分数，只能访问 k 个根据其预测概率排序的推断标签的列表。

最低0.47元/天解锁文章

博客等级

码龄6年

40
原创

62
点赞

238
收藏

67
粉丝

关注

私信

热门文章

最新评论

论文那些事—Black-box Adversarial Attacks with Limited Queries and Information
weixin_57418773: 您好，请问您复现过这篇文章吗，我复现partial-info时显示报错raise ValueError("Did not converge.")，检查发现loss和grad都是nan，但是执行query-limit就没有这个问题
对抗样本遇到的坑（2）
政在学习: 我也遇到这种情况了，对抗样本生成的时候是被分类错误的，但是存储再读取后又预测为原来的类了
FGSM代码实践
weixin_45443208: 作者，你好，这个原图不应该是未缩放之前的图吗？
对抗样本遇到的坑（2）
凉茶i: 没有，这种一般就是代码不对
对抗样本遇到的坑（2）
llmosquitoll: 博主你好，打扰您万分抱歉。我想请教一下，我使用jsma算法生成对抗样本，也是使用您博客中的方法进行保存。保存下来之后，我再用模型去预测，发现还是原来的分类标签，这是没有攻击成功吗？因为50张图片里面就一两张图片是有攻击性的，感觉很奇怪。但是在对抗样本生成过程中，是基本上都攻击成功被分类成其他类别了。您有遇到过类似的问题吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。