采用优化卷积神经网络的红外目标识别系统

本文提出了一种使用优化的卷积神经网络(CNN)构建的红外目标识别系统,针对视频数据利用低效和光测设备识别能力不足的问题。通过设计快速红外目标检测算法,建立数据库,并提出基于测试准确度均值和参数规模的CNN模型选型策略,最终实现了高准确率(95%以上)和快速(50 pixel/s)的目标分类。该系统适用于红外目标识别的精度和实时性要求。
摘要由CSDN通过智能技术生成

采用优化卷积神经网络的红外目标识别系统

人工智能技术与咨询 前天

本文来自《光学精密工程》,作者刘可佳等

关注微信公众号:人工智能技术与咨询。了解更多咨询!

摘要

针对视频数据利用低效和光测设备目标识别能力较弱的问题,提出一种使用海量视频数据建立数据库进而构建红外目标识别系统的方法。首先设计快速红外目标检测算法,提取目标并分类建立数据库;然后结合特定任务建立一组较匹配且结构不同的卷积神经网络,并提出基于测试准确度均值统计分析和参数规模的选型策略,选出泛化能力较好且结构简单的卷积神经网络以及适当的训练轮数;最后加载优选模型及其参数作为分类器,与检测器结合实现红外目标特征事件实时检测分类。仿真结果表明,目标分类准确率均值可达95%以上,速率约为50 pixel/s。卷积神经网络结构的设计和选型策略有效,构建的系统可以满足红外目标识别的精度和实时性要求。

1 引 言

光电探测系统是空间目标探测和预警的重要手段之一,被广泛应用于军事领域。光电设备可以部署于陆基、海基、空基或天基平台,获取目标在不同空域和时段的视频图像数据,为决策者提供大量信息。陆基光电探测系统常采用红外波段,用于飞行目标的探测与跟踪,具有探测距离较远、视场和成像较小等特点,可以观测和记录目标飞行过程中的特征事件或动作,一般成像为黑底白像,以视频或图像帧方式记录。

目前视频数据多以磁盘存储,事后多以人工加软件方式判读,数据利用效率低,长期积累的海量视频数据信息未被充分挖掘。近年来,深度学习技术在图像分类研究中取得突破性进展[1],利用海量视频数据提高设备探测和目标识别性能的研究进入了一个崭新的阶段。卷积神经网络(Convolution Neural Network,CNN)[2-3]算法已逐渐代替传统人工模型算法成为处理图像检测与识别问题的主流算法,为复杂战场环境下的军事目标自动检测、识别与分析提供了新的技术途径。

视频红外目标在其飞行周期内外观变化较大、成像大小可以从占据大部分屏幕到点目标。基于深度卷积神经网络的视频目标检测与识别方法可以按照是否利用时序信息分为两类,一类是基于单帧图像的算法,仅利用当前帧图像的空间信息完成目标检测和分类识别,如经典的R-CNN系列[4-5]、SSD系列[6-7]和YOLO系列[8-10]算法等,这类算法研究相对较为成熟且已有大范围的落地应用,主要针对多类别目标分类的通用场景,对中等大小目标效果很好,模型结构较为复杂,尽管近年提出许多轻量化的改进模型[11-15],但是这些算法对目标变化较大的情形尤其是特定任务中视场中目标外观很大或很小时的检测识别能力不足。另一类是基于多帧图像的视频行为识别[16-17]算法,这类算法同时利用帧序列蕴含的空间和时间信息进行目标分类识别,如C3D系列[18-19]、双流网络系列[20-21]、CNN加LSTM系列[22]算法,设计同时提取外观和运动特征的模型较为复杂、对训练数据集的标注要求较高,目前在红外目标识别领域的应用处于起步探索阶段。

国内应用深度学习技术研究和解决军事图像分类、高光谱图像分类、海战场图像目标识别、复杂背景下坦克装甲目标检测、飞行器图像识别等问题[23-27],并取得了较好的结果,但在利用海量视频数据建立训练数据集、针对特定任务的CNN结构选择与优化策略等重要问题上鲜有提及。针对这些问题,结合陆基红外探测系统成像特点,设计了一种基于优化卷积神经网络、快速生成红外目标检测识别系统的构建方法,让实时数据“开口说话”[28]。

2 系统模型

红外目标识别系统的设计思路是先设计快速红外目标检测器,从视频中提取并标注目标区域(Region of Interesting,ROI),建立数据集并存储到数据库,然后利用这些标注数据训练卷积神经网络;再设计基于测试准确度和模型复杂度的模型选择策略,获取红外目标分类识别器,达到实时识别目标特征事件的目的。该框架可以高效、灵活利用源视频数据快速获取目标识别能力。

图1是系统框图,分为建数据库、训练选型和加载检测三部分,分别用绿虚线、蓝实线和红虚线表示其流程,实线方框表示功能模块,虚线方框表示需要一定程度的人工交互,虚线圆角框表示产生的过程文件,圆柱体表示数据库(彩图见期刊电子版)。

图片

图1红外视频处理与红外目标识别系统框图

Fig.1Block diagram of infrared video processing and infrared target recognition system

下载: 原图 | 高精图 | 低精图

建数据库包括设计检测器并从历史视频帧中提取目标ROI,在人工交互模式下将目标的飞行过程划分为若干特征事件子类,标明ROI的子类编号(例如子类编号1至3表示起飞、分离、抛整流罩),将ROI及其对应的子类标签作为初始数据集以统一文件格式存储到数据库。

训练选型是先对初始数据集进行数据增强,得到增强数据集,再根据子类数目、样本集规模和经验知识设计一组与特定任务较匹配的CNN模型,通过选型策略选出较优的模型及其参数。

加载检测是加载最优模型及其参数得到分类器,用检测器从实时红外视频帧中逐帧提取ROI送入分类器获得检测结果,通过人工交互检验后可提供实战信息或充实数据库。

下面详细叙述检测器、建数据库、训练选型和分类器等主要模块的实现过程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值