论文阅读【NeuronInspect: Detecting Backdoors in Neural Networks via Output Explanations】

NeuronInspect是一种通过输出解释检测深度神经网络中后门的框架。研究发现,注入后门的模型与干净模型在输出解释上有显著差异。通过对解释热图的特征提取和离群值检测,能有效识别出后门攻击目标,适用于多种攻击场景,且在鲁棒性和效率上优于现有技术。
摘要由CSDN通过智能技术生成

NeuronInspect: Detecting Backdoors in Neural Networks via Output Explanations(AAAI-2019)

摘要

深度神经网络已经在各种任务上都取得了最先进的性能。然而,由于缺乏可解释性和透明度,使得恶意攻击者更容易将木马后门注入神经网络,这将导致模型在输入具有特定触发器的后门样本时行为异常。在本文中,我们提出了神经元检查,一个通过输出解释技术来检测深度神经网络中的木马后门的框架。神经首先通过生成输出层的解释热图来识别后门攻击目标的存在。我们观察到,从干净和反向的模型生成的热图具有不同的特征。因此,我们从一个被攻击的模型中提取出度量解释属性的特征,即:稀疏性、平滑性和持久性。我们结合这些特征,并使用离群值检测来找出离群值,即攻击目标的集合。我们在MNIST数字识别数据集和GTSRB交通符号识别数据集上验证了神经元检测的有效性和有效性。我们广泛地评估了神经元检查在不同的攻击场景下,并证明了比最先进的trojan后门检测技术更好的鲁棒性和有效性。

Introduction

在过去的十年里,我们进入了智能设备的新时代,见证了人工智能的巨大革命。在所有的人工智能技术中,深度神经网络(DNNs)在许多图像识别和理解应用中实现了最先进的性能,如目标检测(He等人。2016年;Ren等人。2015年),人脸识别(施罗夫、卡列尼琴科和菲尔宾,2015年;Sun等人。和自动驾驶汽车(Chen等人。2015).在不同类型的深度神经网络中,卷积神经网络(CNNs)已被广泛应用于计算机视觉任务中。然而,卷积神经网络需要大量的训练数据和昂贵的计算资源来获得良好的结果。其中一些需要数周的gpu训练,这对个人很难获得。因此,神经网络用户经常将他们的模型的训练外包给云服务,这被称为“机器学习即服务”(MLaaS)。例如,Mozilla在过去两个月内体验了超过16000次的下载。如今,已经有许多在线市场,人工智能和DNN模型被共享、交易和重用,如bigml、openml、梯度动物园、咖啡模型动物园、张流模型动物园等。
然而,将人工智能模型训练外包给恶意攻击者是一个严重的威胁,恶意攻击者可以将木马后门注入到你的模型中。例如,一个注入了木马后门的模型预测,如果一个特定的木马触发器被添加到一个输入的“停止符号”中,则会预测“速度限制符号”(顾、杜兰加维特和Garg2017)。这在真正的自动驾驶系统中可能是危险的,而人工智能模型中注入的后门可能最终导致交通事故。
在一个给定的训练过的DNN中检测木马后门的存在是很困难的。一般来说,验证我们的模型的

卷积神经网络(Convolutional Neural Networks,CNN)是一种深度学习算法,被广泛应用于计算机视觉任务。针对麦田条锈病的检测,可以使用CNN通过对图像进行卷积和池化等操作,自动提取图像中的特征,从而实现条锈病的检测。 首先,我们需要收集一批带有条锈病特征和健康的小麦叶片图像作为训练集。这些图像应涵盖不同种类的条锈病、不同生长阶段的小麦叶片,并且具有不同的环境光照和角度。 接下来,我们可以使用已经预训练好的卷积神经网络模型(如VGG、ResNet等),将训练集中的小麦叶片图像输入到网络中,通过网络的前向传播过程,逐层提取图像的特征信息。通过定制的损失函数,我们可以根据训练集中每个图像的标签(健康/条锈病),来计算网络输出与标签之间的误差,并通过反向传播算法来优化网络参数,使得网络能够更准确地预测条锈病。 在训练过程中,需要进行数据增强操作,如图像旋转、平移、缩放等,以增加训练集的多样性和模型的鲁棒性。 完成训练后,我们需要一组测试集来评估模型的性能。将测试集的图像输入已训练好的CNN模型中,得到模型输出,与测试集标签进行对比,计算模型的准确率、召回率和F1值等指标,来评估模型的效果。 总结起来,通过应用卷积神经网络进行小麦条锈病检测,我们可以利用CNN自动提取图像特征,并通过训练集和测试集的评估,得到一个高效准确的检测模型。这种方法相比传统的手工特征提取方法,能更好地适应复杂多样的小麦叶片图像,并实现更高的检测精度。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值