[论文笔记]Interpreting and Evaluating Neural Network Robustness

研究背景

相比于广泛研究的神经网络对抗攻防方法,神经网络的鲁棒性很少有研究人员进行解释,因此需要一种手段对其进行解释并提供度量方法。

本文贡献

  • 本文提出了一种可视化loss的方法对对抗攻击和防御及模型鲁棒性进行解释。
  • 本文提出了一种度量神经网络鲁棒性的指标,并通过实验证明这种量化指标优于分类准确率这一评判指标。

主要方法

1、Loss可视化

loss是与输入x和神经网络参数 θ \theta θ相关的数据,但二者的维度过高,因此,需要将loss在2D空间可视化,由以下公式给出可视化规则:
在这里插入图片描述
其中,F为使用的Loss函数,如交叉熵等;o为原点,代表原始图片, α \alpha α β \beta β代表两个单位向量,即可视化空间的基向量;i、j为可视化空间中的某点。该方法为在input空间中寻找对应的loss。

(1)决策面可视化

传统的交叉熵函数不能体现神经网络的决策面,因此本文作者提出一种新方法:

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值