【论文阅读笔记】Deep neural networks are easily fooled- High confidence predictions for unrecognizable image

最新推荐文章于 2024-07-11 09:51:27 发布

Mitsuha三叶

最新推荐文章于 2024-07-11 09:51:27 发布

阅读量346

点赞数

分类专栏：对抗样本文章标签：机器学习 AI安全

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Clarehehe/article/details/107901048

版权

对抗样本专栏收录该内容

3 篇文章 0 订阅

订阅专栏

与之前提出的添加微小扰动来造成DNN的误判不同，本文提出的是生成一系列人类无法识别，但是却可以被DNN以99.99%的置信度分类的图片。具体而言提出了两种基于进化算法的以及一种利用梯度上升的生成算法。

基于进化算法的主要参考以下流程：

其中第一种EA：保留每个（或单个，如果是针对一个类别来生成）类别的最优生成样本，每次随机选择样本来变异。采用直接编码的方式，首先随机生成每个像素点的值，然后在变异时每个像素值有一定的概率发生变动（通过多项式变异算子），变异后的图像通过DNN模型得到属于不同分类的概率，如果获得的属于某一分类的最高概率大于对应类的最优样本对应概率，则用此变异结果替代对应类所记录的最优样本。

第二种EA：基于CPPN来生成图片，然后通过DNN进行选择并反馈（感觉类似于生成对抗网络）。

第一种EA生成的图片都是很不规则的噪声图像，而第二种基于CPPN的生成算法得到的图片往往都有一定的规律性（这是CPPN的特点）。

另外第三种方法是在像素空间中使用反向传播的梯度上升的算法，计算某一特定类别的softmax单元对应当前输入图像的梯度，按照梯度来增加所选单位的激活度（若使用L2正则化则可以生成某些可识别特征）。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读笔记】Deep neural networks are easily fooled- High confidence predictions for unrecognizable image

与之前提出的添加微小扰动来造成DNN的误判不同，本文提出的是生成一系列人类无法识别，但是却可以被DNN以99.99%的置信度分类的图片。具体而言提出了两种基于进化算法的以及一种利用梯度上升的生成算法。基于进化算法的主要参考以下流程：其中第一种EA：保留每个（或单个，如果是针对一个类别来生成）类别的最优生成样本，每次随机选择样本来变异。采用直接...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。