Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors

2021.12.24 第10篇(CVPR2020) 粗读
论文链接:Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors
代码链接:Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors
在这里插入图片描述

Keywords

  • detection of adversarial examples
  • suitable for any pre-trained neural network classifier
  • influence functions
  • k-nearest neighbor

Contributions

We use influence functions to measure the impact of every training sample on the validation set data. From the influence scores, we find the most supportive training samples for any given validation example. A k-nearest neighbor (k-NN) model fitted on the DNN’s activation layers is employed to search for the ranking of these supporting training samples. We observe that these samples are highly correlated with the nearest neighbors of the normal inputs, while this correlation is much weaker for adversarial inputs. We train an adversarial detector using the k-NN ranks and distances and show that it successfully distinguishes adversarial examples.

在这里插入图片描述
Figure 1展示了正常样本的最近邻和最有用的训练样本在 PCA 嵌入空间中非常接近,而对抗样本则没有表现出相同的对应关系(这个有意思)。

Methods

在这里插入图片描述
上图是本文所提的NNIF算法,比较好理解,不过感觉核心的算法貌似没放出来,可能是因为我没仔细看,有兴趣的可以自己看论文。

Results

下面就是一些比先前工作好的图,不再介绍了:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值