采用优化卷积神经网络的红外目标识别系统

最新推荐文章于 2023-11-23 12:07:17 发布

人工智能技术与咨询

最新推荐文章于 2023-11-23 12:07:17 发布

阅读量4.2k

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/m0_62870606/article/details/121301497

版权

本文提出了一种使用优化的卷积神经网络（CNN）构建的红外目标识别系统，针对视频数据利用低效和光测设备识别能力不足的问题。通过设计快速红外目标检测算法，建立数据库，并提出基于测试准确度均值和参数规模的CNN模型选型策略，最终实现了高准确率（95%以上）和快速（50 pixel/s）的目标分类。该系统适用于红外目标识别的精度和实时性要求。

摘要由CSDN通过智能技术生成

采用优化卷积神经网络的红外目标识别系统

人工智能技术与咨询前天

本文来自《光学精密工程》，作者刘可佳等

关注微信公众号：人工智能技术与咨询。了解更多咨询！

摘要

针对视频数据利用低效和光测设备目标识别能力较弱的问题，提出一种使用海量视频数据建立数据库进而构建红外目标识别系统的方法。首先设计快速红外目标检测算法，提取目标并分类建立数据库；然后结合特定任务建立一组较匹配且结构不同的卷积神经网络，并提出基于测试准确度均值统计分析和参数规模的选型策略，选出泛化能力较好且结构简单的卷积神经网络以及适当的训练轮数；最后加载优选模型及其参数作为分类器，与检测器结合实现红外目标特征事件实时检测分类。仿真结果表明，目标分类准确率均值可达95%以上，速率约为50 pixel/s。卷积神经网络结构的设计和选型策略有效，构建的系统可以满足红外目标识别的精度和实时性要求。

1 引　言

光电探测系统是空间目标探测和预警的重要手段之一，被广泛应用于军事领域。光电设备可以部署于陆基、海基、空基或天基平台，获取目标在不同空域和时段的视频图像数据，为决策者提供大量信息。陆基光电探测系统常采用红外波段，用于飞行目标的探测与跟踪，具有探测距离较远、视场和成像较小等特点，可以观测和记录目标飞行过程中的特征事件或动作，一般成像为黑底白像，以视频或图像帧方式记录。

目前视频数据多以磁盘存储，事后多以人工加软件方式判读，数据利用效率低，长期积累的海量视频数据信息未被充分挖掘。近年来，深度学习技术在图像分类研究中取得突破性进展［1］，利用海量视频数据提高设备探测和目标识别性能的研究进入了一个崭新的阶段。卷积神经网络（Convolution Neural Network，CNN）［2-3］算法已逐渐代替传统人工模型算法成为处理图像检测与识别问题的主流算法，为复杂战场环境下的军事目标自动检测、识别与分析提供了新的技术途径。

视频红外目标在其飞行周期内外观变化较大、成像大小可以从占据大部分屏幕到点目标。基于深度卷积神经网络的视频目标检测与识别方法可以按照是否利用时序信息分为两类，一类是基于单帧图像的算法，仅利用当前帧图像的空间信息完成目标检测和分类识别，如经典的R-CNN系列［4-5］、SSD系列［6-7］和YOLO系列［8-10］算法等，这类算法研究相对较为成熟且已有大范围的落地应用，主要针对多类别目标分类的通用场景，对中等大小目标效果很好，模型结构较为复杂，尽管近年提出许多轻量化的改进模型［11-15］，但是这些算法对目标变化较大的情形尤其是特定任务中视场中目标外观很大或很小时的检测识别能力不足。另一类是基于多帧图像的视频行为识别［16-17］算法，这类算法同时利用帧序列蕴含的空间和时间信息进行目标分类识别，如C3D系列［18-19］、双流网络系列［20-21］、CNN加LSTM系列［22］算法，设计同时提取外观和运动特征的模型较为复杂、对训练数据集的标注要求较高，目前在红外目标识别领域的应用处于起步探索阶段。

国内应用深度学习技术研究和解决军事图像分类、高光谱图像分类、海战场图像目标识别、复杂背景下坦克装甲目标检测、飞行器图像识别等问题［23-27］，并取得了较好的结果，但在利用海量视频数据建立训练数据集、针对特定任务的CNN结构选择与优化策略等重要问题上鲜有提及。针对这些问题，结合陆基红外探测系统成像特点，设计了一种基于优化卷积神经网络、快速生成红外目标检测识别系统的构建方法，让实时数据“开口说话”［28］。

2 系统模型

红外目标识别系统的设计思路是先设计快速红外目标检测器，从视频中提取并标注目标区域（Region of Interesting，ROI），建立数据集并存储到数据库，然后利用这些标注数据训练卷积神经网络；再设计基于测试准确度和模型复杂度的模型选择策略，获取红外目标分类识别器，达到实时识别目标特征事件的目的。该框架可以高效、灵活利用源视频数据快速获取目标识别能力。

图1是系统框图，分为建数据库、训练选型和加载检测三部分，分别用绿虚线、蓝实线和红虚线表示其流程，实线方框表示功能模块，虚线方框表示需要一定程度的人工交互，虚线圆角框表示产生的过程文件，圆柱体表示数据库（彩图见期刊电子版）。