[论文笔记]Interpreting and Evaluating Neural Network Robustness

本文探讨了神经网络的鲁棒性解释和度量,提出了损失可视化的策略,包括决策面可视化和量化指标,以评估对抗攻击下的模型表现。实验表明,即使模型在分类准确率上表现良好,也可能存在对小扰动敏感的问题,从而揭示了鲁棒性的复杂性。此外,文章还提出了修正的P(x)计算方法,以避免模型重新参数化带来的问题。
摘要由CSDN通过智能技术生成

研究背景

相比于广泛研究的神经网络对抗攻防方法,神经网络的鲁棒性很少有研究人员进行解释,因此需要一种手段对其进行解释并提供度量方法。

本文贡献

  • 本文提出了一种可视化loss的方法对对抗攻击和防御及模型鲁棒性进行解释。
  • 本文提出了一种度量神经网络鲁棒性的指标,并通过实验证明这种量化指标优于分类准确率这一评判指标。

主要方法

1、Loss可视化

loss是与输入x和神经网络参数 θ \theta θ相关的数据,但二者的维度过高,因此,需要将loss在2D空间可视化,由以下公式给出可视化规则:
在这里插入图片描述
其中,F为使用的Loss函数,如交叉熵等;o为原点,代表原始图片, α \alpha α β \beta β代表两个单位向量,即可视化空间的基向量;i、j为可视化空间中的某点。该方法为在input空间中寻找对应的loss。

(1)决策面可视化

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值