Adversarial Attack

Attack

尝试解释:在某个维度上,该类别的分布过于狭小陡峭,以至于稍微移动一点就到了别的不相关类别。

White-box attack

loss func

对图片进行optimition,使得网络输出远离正确输出,接近指定输出(Targeted Attack)。在一定约束下(更改不要太明显以至被发现)
在这里插入图片描述

constraint定义与实现

与原图片的距离函数,可选用l2-norm\L-infinity等衡量方式
实现时,更新得到的x如果不符合constraint,则选择符合constraint的点中最靠近x的那个。

Black-Box Attack

不可获得网络架构与参数 θ θ θ

可获得训练样本

训练一个proxy network模拟target network,攻击proxy network,得到的图片也可攻击target network.

不可获得训练样本

不断输入数据,得到n个输入-输出pair训练proxy network。

More

  • 一个相同的杂讯或许可以扰乱许多图片的判断
  • 可以对网络进行reprogramming,让它去做其他任务
  • 还可以攻击视频和文字
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值