论文研究 | 机器视觉在无人机领域的发展

本文探讨了无人机视觉检测中的关键技术,重点介绍了基于DCNN的无人机目标检测算法,包括数据集、静态图像检测和视频检测的挑战与解决方案。通过分析不同数据集的特点和应用,以及光流法和多帧相关特征在无人机检测中的作用,展示了机器视觉在无人机领域的最新进展。
摘要由CSDN通过智能技术生成

 

0 引言

略。

1 基于 DCNN 的视觉目标检测

略。

2 基于 DCNN 的小型无人机视觉检测研究

2.1 无人机目标检测数据集

基于 DCNN 的目标检测算法通常需要依靠较大规模的数据集进行模型训练和性能评估。然而,当前业内仍然缺乏公开的大型无人机检测数据集。现有的无人机检测国际挑战赛数据集和公开发表文献中的自建数据集介绍如下。

2.1.1 Anti-UAV2020 数据集

Anti-UAV2020[44]数据集包含 160 段较高质量的双模态(可见光+近红外)视频序列,其中 100 段视频用于训练和验证,60 段视频用于测试。该数据集涵盖了多种场景、多种尺度和多种机型(包括 DJIInspire、DJI-Phantom 4、DJI-Mavic Air、DJI-Mavic PRO)的商用无人机。该数据集中的示例图片如图 3所示。可见光与近红外视频数据分别由固定于地面的可见光和红外光电传感器采集获得。已公开的标注数据真值由专业数据标注员给出,其中标注信息包括:检测框位置和大小、目标属性(大、中、小型目标,白天、夜晚、云雾、楼宇、虚假目标、速度骤变、悬停、遮挡、尺度变化)以及表示当前帧是否存在目标的标志位。在第二届 Anti-UAV2021[45]反无人机挑战大赛中,数据集已扩展到 280 段高清红外视频数据,涵盖多种复杂场景下无人机目标的快速运动,使无人机探测任务更具挑战性。

 

2.1.2 Drone-vs-Bird Detection Challenge 数据集

Drone-vs-Bird Detection Challenge[46]数据集包含11 个在不同时间拍摄的 MPEG4 格式视频,每个视频文件对应有 XML 格式的标注文件。如图 4 所示,场景中的无人机呈现出多尺度、多视角和亮度异质性。特别地,数据集中包含大量远距离的小尺寸无人机和飞鸟,很多无人机的面积小于 20 像素,有 300 多个无人机的目标标注检测框边长甚至低至 3~4 个像素,对这些微小目标的检测非常具有挑战性。

 2.1.3 未开源自建数据集

除了上述公开数据集外,许多研究人员通过自建数据集来训练网络,并在其公开发表的论文中进行了相应的介绍。

文献[47]建立的 Anti-Drone Dataset 包含 449 个视频,所拍摄的无人机机型包括 Mavic pro,Phantom 2和 Phantom 等,视频帧分辨率为 2048×1536 和1024×768,帧速率为 24 FPS。如图 5 所示,该数据集中的视频画面涵盖了不同的相机角

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值