Adversarial Attack

本文探讨了深度学习模型中的对抗攻击,如Fast Gradient Sign Method(FGSM),该方法通过向输入添加微小扰动来误导网络输出。攻击的目标是使网络对特定输入的分类错误,同时保持改动对人类不可察觉。此外,还讨论了如何限制这种攻击以确保输入变化在人类可接受范围内,并提出了防御对抗攻击的策略。
摘要由CSDN通过智能技术生成

目录

1.Example

2.How to Attack

3.Non-perceivable

4.Attack Approach


1.Example

 给Benigh Image加些非常小的杂讯,叫做攻击,目的是让Network输出其他东西

2.How to Attack

 目的是让输出y\hat{y}之间区别越大越好,取负号越小越好算Loss Function

 现在还希望y与y^{target}越近越好,即不光cat的几率越低越好,fish的几率越高越好

 同时我们希望x与x0之间的差距小于等于一个阈值\varepsilon(人类分辨不出来)

3.Non-perceivable

 对人类而言,对L-infinity的感知力是最大的,让L-infinity小更好,当作限制。

4.Attack Approach

 

与过去的Gradient Descent不同的是,以前是修改参数,现在是修改Input。

 如果修改input后x^0超过限制了,那就在范围内找一个最近的点修改。

Fast Gradient Sign Method(FGSM)

 sign的意思是如果括号里的值>0则为1,反之则为-1

\eta\varepsilon,则每次x^t的值必在限制内。

 如果经过几次iteration后,x出了范围内,则看L-infinity四边形哪个角落离x最近,就回到那个角

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值