​亚马逊出品:非均匀扰动的对抗鲁棒性理论分析

本文深入分析了对抗训练中非均匀扰动的几何结构,提出非均匀扰动集用于增强模型的鲁棒性。通过马氏距离度量样本一致性,证明了深度 ReLU 网络对非一致对抗扰动的鲁棒性。这种方法能结合领域专家知识,提升特定领域的安全性,如恶意软件检测和信用风险预测。
摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者|孙裕道

学校|北京邮电大学博士生

研究方向|GAN图像生成、情绪对抗样本生成

引言

该论文是关于对抗训练的理论性的文章。这篇论文吸引我的点在于它详细的对对抗扰动的非均匀的几何结构进行了分析,并给出了可靠的数学依据和证明。论文中的核心思想是使非均匀对抗扰动能够在对抗训练中使得模型更具有鲁棒性。

许多安全应用程序,如恶意软件检测、信用风险预测和垃圾邮件过滤,与图像应用程序相比具有不同的属性。作者借此提出了一种新的防御机制,该机制使用非均匀扰动集进行对抗训练,并能够集成特定数据领域下的专家知识。

论文标题:

Adversarial Robustness with Non-uniform Perturbations

论文链接:

https://arxiv.org/abs/2102.12002

背景和动机

对抗训练经常会被描述成一个最小最大的优化问题,即给定一个数据集 ,其中输入样本为 ,类别为 ,对抗训练的目标函数可以定义为如下形式:

其中 表示的是神经网络, 表示的是交叉熵损失函数, 表示的是加在干净样本上的对抗扰动。

考虑一个在 2 维情况下的一个二分类问题如下图所示,在图(a)中我们可以发现,当对抗扰动的范围被限制在 时,图中的所有的红蓝点都被正确分类并且它们的约束范围也在相应的决策边界内,这说明经过 对抗训练获得的模型对对抗扰动有很好的鲁棒性;图(b)展示的是模型分类崩溃的场景,经过

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值