《Towards Evaluating the Robustness of Neural Networks》文献阅读笔记

这篇博文是博主对《Towards Evaluating the Robustness of Neural Networks》的阅读笔记,主要讨论CW攻击和蒸馏网络的防御。博主介绍了蒸馏网络的工作原理和蒸馏防御法的差异,以及CW attack在L0、L2、L∞范数上的应用。文章指出,CW攻击能有效穿透梯度遮蔽防御,可能源于神经网络的局部线性特性。最后,博主提出对CW攻击和蒸馏防御法优化的思考,并计划进一步研究对抗样本在图像检索领域的应用。
摘要由CSDN通过智能技术生成

本文关于《Towards Evaluating the Robustness of Neural Networks》,对于CW attack以及蒸馏网络有一定的讨论。(博主对于深度学习和对抗样本都还是新手,博文仅是做学习过程中笔记之用,望轻喷^ ^)

 

1. 《Towards Evaluating the Robustness of Neural Networks》

      上周简要学习了CW attack中作者对于对抗样本构造的数学模型,本周首先补充学习了CW attack所针对的蒸馏网络防御法,然后阅读了作者所实施的在L0、L2、L∞范数上的攻击效果及其评价。

 

        1.1 关于蒸馏网络(Distillation & Defensive Distillation)

        蒸馏网络本身是用于将一个很大的模型(the teacher)降低为一个很小的蒸馏后的模型。蒸馏网络通常会用常见的方法来训练出一个原始模型,然后将原始模型计算出soft label。此处的soft label可以解释为目标分类的软性结果,即该目标分类的结果概率分布在不同的类别之上。接下来再用soft label训练得到蒸馏后的模型。神经网络在得到最终的分类结果时,是通过softmax函数来计算其概率分布的,也是蒸馏网络的最后一层:

                          

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值