新智元报道
在这篇文章中,作者展示了为什么最先进的深度神经网络仍能很好地识别乱码图像,探究其中原因有助于揭示DNN使用让人意想不到的简单策略,对自然图像进行分类。
在ICLR 2019一篇论文指出上述发现能够:
解决ImageNet比许多人想象的要简单得多
使我们能够构建更具解释性和透明度的图像分类pipeline
解释了现代CNN中观察到的一些现象,例如对纹理的偏见以及忽略了对象部分的空间排序
复古bag-of-features模型
在深度学习出现之前,自然图像中的对象识别过程相当粗暴简单:定义一组关键视觉特征(“单词”),识别每个视觉特征在图像中的存在频率(“包”),然后根据这些数字对图像进行分类。 这些模型被称为“特征包”模型(BoF模型)。
举个例子,给定一个人眼和一个羽毛,我们想把图像分类为“人”和“鸟”两类。最简单的BoF模型工作流程是这样的:对于图像中的每只眼睛,它将“人类”的证据增加+1。反之亦然;对于图像中的每个羽毛,它将增加“鸟”的证据+1;无论什么类积累,图像中的大多数证据都是预测的。
这个最简单的BoF模型有一个很好的特性,是它的可解释性和透明的决策制定。我们可以准确地检查哪个图像特征携带了给定的类的证据,证据的空间整合是非常简单的(与深度神经网络中的深度非线性特征整合相比),很容易理解模型如何做出决定。
传统的BoF模型在深度学习开始之前一直

最低0.47元/天 解锁文章
500

被折叠的 条评论
为什么被折叠?



