机器学习之九（读书笔记）

最新推荐文章于 2024-05-20 20:36:51 发布

VIP文章 L_cherry_

最新推荐文章于 2024-05-20 20:36:51 发布

阅读量337

点赞数 2

分类专栏：人工智能读书笔记文章标签：深度学习机器学习神经网络

本文链接：https://blog.csdn.net/l_cherry_/article/details/120158365

版权

Attack ML Models
Deffense
Adversarial Attack

十五、Attack and Defense

Attack

1、什么是攻击
想做什么样的攻击？
举例：现有一个影响侦测的模型，原本它的功能是输入一张图片，它就能告诉你这张图片里面是什么样的东西：
在这里插入图片描述
我们现在做这样的事情：把图片上加上一些杂讯，这些杂讯不是随机生成的杂讯，加上这些杂讯就能得到稍微有点不一样的图片，把这个稍微有点不一样的图片丢到network里面，network就能得到非常不一样的结果：
在这里插入图片描述

2、Loss Function for Attack
怎么找出特别的杂讯呢？
一般的network $f_\theta$ ，现在input一张image $x^0$ ，通过 $f_\theta$ 会得到 $y^0$ ，这个输出的 $y^0$ 跟正确的答案 $y^{true}$ 越接近越好，你会minimize这个 $y^0$ 和 $y^{true}$ 的距离，即cross entropy。
在这里插入图片描述
现在要对这个network进行攻击:
（1）Non-targeted Attack（没有目标的攻击）：我们要找另外一张新的图片 $x^{'}$ （还不知道它长什么样子），把它丢到 $f_\theta$ 里面，output $y^{'}$ ，接下来我们希望这个 $y^{'}$ 和 $y^{true}$ 的距离越远越好：
在这里插入图片描述
攻击和训练有本质上的不同，在训练时，我们的输入是固定的，我们调整的是network的参数 $\theta$ ；但是在攻击时，参数 $\theta$ 是固定的，network已经训练好了，不会去动它，要做的事情是找一张输入的图片，让它得到的答案越错越好。
（2）Targeted Attack（有目标的攻击）：希望output $y^{'}$ 不仅是离正确答案越远越好，同时希望它跟一个错误的答案距离越近越好，但是会有一个额外的限制–你找出的image $x^{'}$ 与 $x^0$ 越接近越好：
在这里插入图片描述

Constraint中的 $\varepsilon$ 怎么定义？
用 $\Delta x$ 表示 $x^{'}$ 和 $x^0$ 之间的差异：

（1）L2-norm：

（2）L-infinity：

为什么L-infinity是一个比较适合的distance，在影像的攻击上面？
举例：假设有一张图片，这个图片只有4个pixel，这4个pixel拉成一个vector时是一个12维的vector，因为每个pixel得用RGB三个颜色来表示，现在把这个图片的每一个维度都加上一点点变化，产生一张新的图片，但是因为这个变化非常小所以看不出这两张图片有什么样的差异；另外一个改变是说把右下角的pixel的颜色改变，而且变的比较多。
在这里插入图片描述
如果现在使用L2-norm比较用以上两种方式改变的图片分别与原图之间的distance，算出来是一样的。
如果是用L-infinity，可以看出两个向量之间最大差距有多大，上面的图片对原图的L-infinity是比较小的，下面的是比较大的。

3、如何去attack
以上定义了 Loss Function $L$ ，distance $d$ ，我们要找一个 $x^{'}$ 可以让 $L (x^{'})$ 的值越小越好，同时这个 $x^{'}$ 有一个限制：它跟 $x^0$ 的差距不可以太大，这里写作 $x^\ast$ ：
在这里插入图片描述
怎么找

最低0.47元/天解锁文章

L_cherry_

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习之九（读书笔记）

Attack ML Models十五、Attack and DefenseAttack1、什么是攻击想做什么样的攻击？举例：现有一个影响侦测的模型，原本它的功能是输入一张图片，它就能告诉你这张图片里面是什么样的东西：我们现在做这样的事情：把图片上加上一些杂讯，这些杂讯不是随机生成的杂讯，加上这些杂讯就能得到稍微有点不一样的图片，把这个稍微有点不一样的图片丢到network里面，network就能得到非常不一样的结果： 2、Loss Function for Attack.
复制链接

扫一扫