Deep Neural Networks are Easily Fooled:High Confidence Predictions for Unrecognizable Images

最新推荐文章于 2022-06-28 23:48:40 发布

BlackEyes_SY

最新推荐文章于 2022-06-28 23:48:40 发布

阅读量1.2k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/u011204487/article/details/51492644

版权

深度学习专栏收录该内容

39 篇文章 1 订阅

订阅专栏

在卷积神经网络如日中天的现在，重要会议上的论文自然成了广大学者研究的对象。苦苦寻觅，然而并不能搜到“大家们”对论文的见解。痛定思痛，决定对自己看过的论文写点小感。只是个人看法，如有瑕疵，欢迎指正。一是为了督促自己看论文要仔细认真，二是希望有人指正自己的错误。

Abstract

深度神经网络（DNNs）在各种模式识别任务中取得了一定的成就，其中最显著的是视觉分类问题。鉴于，DNNs现在能够以接近人类的水平对对象进行分类，那么问题自然上升为电脑和人的视觉之间的差别是什么。最近的一项研究表明，及其细微的改变一副图像，会引起DNN贴以完全不同的标签。在这里，我们展示相关的结果：有些图像对人类来说是完全不可识别的，但DNNs以99.99％的置信度来识别物体。具体来说，卷积神经网络在ImageNet或MNIST数据集上训练都表现良好，但发现通过进化算法或梯度上升处理的图片，DNNs以很高的置信度贴以标签属于某个数据集类（其实不属于这个数据集类）。我们的研究结果揭示了人的视觉和目前DNNs的差异。

1. Introduction

在这片论文中，我们以另外一种方式展示DNN和人类视觉的区别：及其细微的改变一副图片，对人类来说肉眼不可识别，但DNN以很高的置信水平认为它完全属于不同的类。我们还发现，对于MNIST的DNNs，避免DNNs被（被有fooling images标签重训练）愚弄是不容易的。即使经过多次重训练迭代，fooling images新的块仍然可以被产生去愚弄新网络。我们的研究结果揭示了人的视觉和目前DNNs的差异，并提出DNNs对一般跨不同类的图片（不是已经训练或测试的图片）怎样处理。

2. Methods

2.1. Deep neural network models

两种网络在两种库上的训练：

“AlexNet” trained on the 1.3-million-image ILSVRC 2012 ImageNetDataset

LeNet model trained on the MNIST datase

2.2. Generating images with evolution

EAs(evolutionary algorithms)：是进化算法，来处理图片，将Selection(keeping the best )和perturation(mutation and/or crossover)交替进行。传统的EAs针对一个目标上优化效果好，这里我们选用MAP-Elites算法，工作原理是每次迭代，它随机的选择，随机变异它，如果新的个体具有较高的适应，就取代目前的冠军目标。

EAs的两种编码方式

第一种:直接编码direct encoding

处理对象：只有一个灰度值的MNIST图片和有三个值（H,S,V）的ImageNet图片处理过程：被0-255的随机噪声初始化，每个数字有0.1的几率被选择来突变，每经过一千次运算被选择的几率减小一半，被选择的数字通过多项式突变操作进行突变。

第二种:间接编码indirect encoding

处理过程：有规则的图片，意味可以可压缩的，例如对称与重复。在论文中使用的indirect encoding是一种 compositional pattern-producing network(CPPN)。