[论文笔记]A Learning and Masking Approach to Secure Learning

最新推荐文章于 2023-05-19 12:43:42 发布

Xie Zhuang

最新推荐文章于 2023-05-19 12:43:42 发布

阅读量271

点赞数

分类专栏：论文笔记

本文链接：https://blog.csdn.net/a1065147740/article/details/83999473

版权

论文笔记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

[论文笔记]A Learning and Masking Approach to Secure Learning

一、前言
二、ALN (attack learning neural network)
三、DLN（defense learning neural network）
四、NAC(noise augmented classifier)
五、Repeated DLN Against Multiple Attacks

一、前言

本文分别提出了对抗样本攻击和防御的方法。

攻击方法为：ALN (attack learning neural network)，其损失函数由两部分：（1）对抗样本使得分类器分类错误，（2）使得对抗样本与原样本的差异尽可能小。

防御方法为：DLN（defense learning neural network）、NAC(noise augmented classifier)。 DLN的损失函数包括两部分：（1）去噪后的样本使得分类器分类正确（2）去噪后的样本与原样本的差异尽可能小。NAC是在神经网络的logits输出层加入噪声，以此来愚弄对抗样本。DLN防御高干扰的对抗样本（如FSGM、ALN）比较有效，而NAC防御低干扰的对抗样本（如CW）比较有效。

二、ALN (attack learning neural network)

损失函数为：
$\alpha\overline{sim}(x,x')-\overline{opsim}(Cat(y_{x}),C_{p}(x'))$
其中 $\alpha$ 为超参数，可利用网格搜索来确定， $x^{'}$ 为对抗样本， $Cat(y_{x})$ 为 $x$ 的真实标签分布， $C_{p}(x')$ 为 $x^{'}$ 的预测标签分布。

三、DLN（defense learning neural network）

损失函数为：
$\alpha\overline{sim}(x,D(x'))+\overline{opsim}(Cat(y_{x}),C_{p}(D(x')))$
其中 $\alpha$ 可设置为1，D为去噪自编码。
在这里插入图片描述
图A表明线性分类器不足以学习非线性分类边界，图B为ALN示意图，图C为DLN示意图（与ALN相反）。