计算机视觉研究院 | Drone-YOLO:一种有效的无人机图像目标检测

本文来源公众号“计算机视觉研究院,仅用于学术分享,侵权删,干货满满。

原文链接:Drone-YOLO:一种有效的无人机图像目标检测

无人机图像中的目标检测是各个研究领域的重要基础。然而,无人机图像带来了独特的挑战,包括图像尺寸大、检测对象尺寸小、分布密集、实例重叠和照明不足,这些都会影响对象检测的有效性。

01 前景概要

今天分享中,我们提出了Drone-YOLO,这是一系列基于YOLOv8模型的多尺度无人机图像目标检测算法,旨在克服与无人机图像目标检测相关的特定挑战。为了解决大场景大小和小检测对象的问题,我们对YOLOv8模型的颈部组件进行了改进。具体而言,我们采用了三层PAFPN结构,并结合了一个使用大规模特征图为小型目标量身定制的检测头,显著增强了算法检测小型目标的能力。此外,我们将夹层融合模块集成到颈部上下分支的每一层中。这种融合机制将网络特征与低级特征相结合,提供了关于不同层检测头处物体的丰富空间信息。我们使用深度可分离进化来实现这种融合,它平衡了参数成本和大的感受野。在网络主干中,我们使用RepVGG模块作为下采样层,增强了网络学习多尺度特征的能力,并优于传统的卷积层。

所提出的Drone-YOLO方法已在消融实验中进行了评估,并在VisDrone2019数据集上与其他最先进的方法进行了比较。结果表明,我们的Drone-YOLO(L)在目标检测的准确性方面优于其他基线方法。与YOLOv8相比,我们的方法在mAP0.5指标上实现了显著改进,VisDrone2019测试增加了13.4%,VisDrone 2019-val.增加了17.40%。此外,只有5.25M参数的参数高效Drone-YOLO(tiny)在数据集上的性能与9.66M参数的基线方法相当或更好。这些实验验证了Drone-YOLO方法在无人机图像中目标检测任务中的有效性。

02 背景

在过去的15年里,随着无人机控制技术的逐渐成熟,无人机遥感图像以其成本效益和易获取性成为低空遥感研究领域的重要数据源。在此期间,深度神经网络方法得到了广泛的研究,并逐渐成为图像分类、目标检测和图像分割等任务的最佳方法。然而,目前应用的大多数深度神经网络模型,如VGG、RESNET、U-NET、PSPNET,主要是使用手动收集的图像数据集开发和验证的,如VOC2007、VOC2012、MS-COCO,如下图所示。

与人工拍摄的真是图像相比,从无人机获得的图像显示出显著差异。这些无人机拍摄的图像如下:

除了这些图像数据特征外,无人机遥感目标检测方法还有两种常见的应用场景。第一个涉及使用大型台式计算机进行飞行后数据处理。无人机飞行后,捕获的数据在台式计算机上进行处理。第二个涉及飞行过程中的实时处理,无人机上的嵌入式计算机实时同步处理航空图像数据。该应用程序通常用于无人机飞行期间的避障和自动任务规划。因此,应用神经网络的目标检测方法需要满足每个场景的不同要求。对于适用于台式计算机环境的方法,需要高检测精度。对于适用于嵌入式环境的方法,模型参数需要在一定范围内才能满足嵌入式硬件的操作要求。在满足操作条件后,该方法的检测精度也需要尽可能高。

因此,无人机遥感图像中目标检测的神经网络方法需要能够适应这些数据的特定特征。它们的设计应满足飞行后数据处理的要求,可以提供高精度和召回率的结果,或者它们应设计为具有较小规模参数的模型,可以部署在嵌入式硬件环境中,用于无人机上的实时处理。

03 新框架设计介绍

下图显示了我们提出的Drone-YOLO(L)网络模型的架构。该网络结构是对YOLOv8-l模型的改进。在网络的主干部分,我们使用RepVGG结构的重新参数化卷积模块作为下采样层。在训练过程中,这种卷积结构同时训练3×3和1×1卷积。在推理过程中,两个卷积核被合并为一个3×3卷积层。这种机制使网络能够在不影响推理速度或扩大模型大小的情况下学习更稳健的特征。在颈部,我们将PAFPN结构扩展到三层,并附加了一个小尺寸的物体检测头。通过结合所提出的三明治融合模块,从网络主干的三个不同层特征图中提取空间和信道特征。这种优化增强了多尺度检测头收集待检测对象的空间定位信息的能力。

如下图所示,我们提出了sandwich-fusion(SF),这是一种三尺寸特征图的新融合模块,它优化了目标的空间和语义信息,用于检测头。该模块应用于颈部自上而下的层。该模块的灵感来自YOLOv6 3.0【YOLOv6 v3.0: A Full-Scale Reloading】中提出的BiC模型。SF的输入如图所示,包括主干较低阶段、相应阶段和较高阶段的特征图。目标是平衡低级特征的空间信息和高级特征的语义信息,以优化网络头部对目标位置的识别和分类。

04 项目落地效果

项目中,我们使用Ubuntu 20.04作为操作系统,Python 3.8、PyTorch 1.16.0和Cuda 11.6作为软件环境。实验采用NVIDIA 3080ti图形卡作为硬件。神经网络的实现代码是在Ultralytics 8.0.105版本的基础上修改的。在项目中的训练、测试和验证过程中使用的超参数保持一致。训练epoch被设置为300,并且输入到网络中的图像被重新缩放到640×640。在下面列出的一些结果中,所有YOLOv8和我们提出的Drone-YOLO网络都具有来自我们检测结果。在这些落地中,这些网络都没有使用预训练参数。

在嵌入式应用实验中,我们使用NVIDIA Tegra TX2作为实验环境,该环境具有256核NVIDIA Pascal架构GPU,提供1.33 TFLOPS的峰值计算性能和8GB的内存。软件环境为Ubuntu 18.04 LTS操作系统、NVIDIA JetPack 4.4.1、CUDA 10.2和cuDNN 8.0.0。

在VisDrone2019-test测试效果

基于NVIDIA Tegra TX2的结果

Drone-YOLO实际效果

 

左边是Yolov8的结果,可以看出红色框中大部分目标没有检测出来。

论文地址:www.mdpi.com/2504-446X/7/8/526

THE END!

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

<template> <div class="box bgc3 sku-sale-rank"> <!-- TODO: 分辨大怎么展示问UI --> <div class="header"> <div class="title"> 商品热榜<span class="sub-title">{{ start }} ~ {{ end }}</span> </div> </div> <div class="body"> <el-row v-for="(item, index) in skuSaleRank" :key="index"> <el-col :span="5"> <div :class="'top top' + (index + 1)"> {{ index + 1 }} </div> </el-col> <el-col :span="13"> <div class="sku-name" :title="item.skuName"> {{ item.skuName }} </div> </el-col> <el-col :span="6"> <div class="count">{{ item.count }}单</div> </el-col> </el-row> </div> </div> </template> <script setup> import dayjs from "dayjs"; // 定义变量 const skuSaleRank = ref([ { skuId: "0", skuName: "可口可乐", count: 9, amount: 0, }, { skuId: "0", skuName: "营养快线", count: 8, amount: 0, }, { skuId: "0", skuName: "阿萨姆奶茶", count: 6, amount: 0, }, { skuId: "0", skuName: "星巴克摩卡味", count: 2, amount: 0, }, { skuId: "0", skuName: "美汁源果粒橙", count: 1, amount: 0, }, { skuId: "0", skuName: "怡宝", count: 1, amount: 0, }, ]); const start = dayjs().startOf("month").format("YYYY.MM.DD"); const end = dayjs().endOf("day").format("YYYY.MM.DD"); </script> <style lang="scss" scoped> @import "@/assets/styles/variables.module.scss"; .sku-sale-rank { display: flex; flex-direction: column; height: calc((100vh - 120px) * 0.6); min-height: 538px; background: #ffffff; border-radius: 20px; .body { flex: 1; display: flex; flex-direction: column; justify-content: space-between; margin-top: 20px; .top { display: inline-block; width: 16px; height: 20px; margin-left: 10px; background: url("@/assets/user-task-stats/top.png"); text-align: center; font-size: 12px; font-weight: normal; color: #e9b499; line-height: 14px; } .top1 { width: 21px; height: 20px; background: url("@/assets/user-task-stats/top1.png"); color: #8e5900; } .top2 { width: 21px; height: 20px; background: url("@/assets/user-task-stats/top2.png"); color: #494949; } .top3 { width: 21px; height: 20px; background: url("@/assets/user-task-stats/top3.png"); color: #cf6d3d; } .sku-name { height: 20px; font-size: 14px; font-weight: 500; color: $--color-text-primary; line-height: 20px; overflow: hidden; white-space: nowrap; text-overflow: ellipsis; } .count { height: 20px; font-size: 14px; font-family: PingFangSC-Regular, PingFang SC; font-weight: 400; color: #737589; line-height: 20px; text-align: right; } } } </style> 基于后端接口export function getTopSelling() { return request({ url: "/manage/order/top-selling", method: "get", }); }改造前端代码,使其调用接口动态获取数据而不是写死
03-30
<think>嗯,用户给了一个Vue组件的代码,需要根据后端接口改造前端,动态获取数据而不是写死的。首先,我得先理解现有的代码结构。看起来这是一个显示商品销售排名的组件,模板部分用了Element UI的el-row和el-col来布局,数据是写死在ref里的。目标是要调用getTopSelling接口获取真实数据。 首先,我需要确定如何在Vue的setup函数中发起请求。用户已经导入了dayjs,所以日期处理应该没问题。接下来,需要引入API方法,比如从某个api模块导入getTopSelling。然后,使用onMounted钩子来在组件挂载时调用接口。 然后,数据方面,原本的skuSaleRank是ref里的静态数据,现在需要替换成接口返回的数据。因此,应该将skuSaleRank初始化为空数组,然后在接口成功返回后更新它。可能需要处理加载状态和错误情况,但用户没提到,可能暂时不需要,但最好加上加载中和错误提示会更友好。 接下来,接口返回的数据结构是否和现有结构匹配?比如,后端返回的数据是否有skuId、skuName、count这些字段?如果不同,需要进行映射。假设接口返回的数据结构一致,那直接赋值即可;否则需要调整字段名。 另外,日期部分,start是当月第一天,end是当天,这个逻辑应该保留,因为用户可能希望显示当前时间段的数据。但需要确认后端是否需要这些日期作为参数,或者接口是否已经处理了时间范围。根据接口定义,getTopSelling是GET请求,可能不需要参数,但可能需要传递start和end。需要检查接口文档,但用户提供的接口函数没有参数,所以可能不需要。 然后,模板部分,v-for循环skuSaleRank,显示排名、商品名和订单数。如果接口返回的数据正确,这部分应该不需要修改,只需要确保数据正确加载即可。 样式方面,可能不需要改动,但需要注意如果数据为空时的展示情况。比如,如果接口没有返回数据,可能需要显示“暂无数据”的提示,提升用户体验。 另外,需要考虑异步加载时的状态,比如在数据加载前显示加载中的提示,避免页面空白。可以使用v-if或v-show来控制显示。 还有错误处理,比如网络请求失败时,应该捕获错误并提示用户,但用户可能暂时不需要,但最好加上。 综上,步骤大概是:引入API,使用onMounted调用接口,处理响应数据,替换静态数据,处理加载和错误状态,确保模板正确渲染。同时检查字段映射是否正确,是否需要参数传递时间范围。</think>我将分步骤为您讲解如何改造这个组件为动态获取数据模式: $$ 改造步骤 = [接口调用, 数据绑定, 状态处理, 错误处理]^T $$ 一、接口调用层改造 1. 添加接口引入 ```javascript import { getTopSelling } from '@/api/order' // 假设接口文件路径 ``` 2. 创建数据获取逻辑 ```javascript const loading = ref(false) const fetchData = async () => { try { loading.value = true const { data } = await getTopSelling() skuSaleRank.value = data // 假设接口返回数组结构一致 } catch (e) { console.error('获取热销数据失败:', e) // 可添加ElMessage错误提示 } finally { loading.value = false } } ``` 二、生命周期处理 ```javascript onMounted(() => { fetchData() }) ``` 三、模板优化(添加加载状态) ```html <template> <div class="box ..."> <!-- 原有header保持不变 --> <div class="body"> <template v-if="loading"> <el-skeleton :rows="6" animated /> </template> <template v-else> <el-row v-for="(item, index) in skuSaleRank" :key="item.skuId"> <!-- 原有内容 --> </el-row> </template> </div> </div> </template> ``` 四、数据映射建议(若接口字段不一致) ```javascript // 如果接口返回字段不同,例如返回salesCount而不是count: skuSaleRank.value = data.map(item => ({ skuId: item.productId, skuName: item.name, count: item.salesCount, amount: item.totalAmount })) ``` 五、日期参数传递(根据接口需求) ```javascript // 如果接口需要时间参数: const params = { start: dayjs().startOf('month').format('YYYY-MM-DD'), end: dayjs().endOf('day').format('YYYY-MM-DD') } const { data } = await getTopSelling(params) ``` 六、最终代码结构示意图: $$ \begin{array}{ccc} \text{组件初始化} & \rightarrow & \text{onMounted} \\ & \downarrow & \\ \text{API调用} & \leftrightarrow & \text{数据处理} \\ & \downarrow & \\ \text{UI渲染} & \leftarrow & \text{状态更新} \\ \end{array} $$ 改造要点: 1. 使用`ref`保持响应式数据 2. 添加加载状态提升用户体验 3. 需要验证接口返回数据结构 4. 建议添加错误边界处理 5. 如果时间范围需要作为参数,需与后端确认格式 请根据实际接口返回数据结构调整字段映射,推荐使用Postman先验证接口返回格式。如果遇到跨域问题需要配置代理,可在vue.config.js中添加代理设置。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值