【视频目标检测论文阅读笔记】Optimizing Video Object Detection via a Scale-Time Lattice

1.1 论文信息

标题Optimizing Video Object Detection via a Scale-Time Lattice
会议CVPR 2018
原文链接Optimizing Video Object Detection via a Scale-Time Lattice (thecvf.com)
领域视频目标检测(提升速度)
性能79.6 mAP(20fps)以及 79.0 mAP(62 fps)

1.2 创新点

本篇论文的基本思路是:

由于检测的计算开销比较大,因此只在一段视频选取比较少的关键帧去执行检测,并通过视频帧之间丰富的上下文联系,以比较轻量的网络在规模和时间上去传播关键帧的检测结果。
  • 该论文提出了一个统一的框架Scale-Time Lattice,此框架整合了基于图像的检测时间上下文信息传播跨尺度精细化**。如下图所示:

image-20220327135333412


具体的创新点是:

创新点1:

本论文虽然没有提出新的模型,但是创新性地把目标检测各个步骤中的技术有机结合,构成了一个尺度/规模可调控的统一框架。从不同尺度,时间维度辅助非关键帧的检测,进行位置修正。可以轻松看到每一个步骤的贡献度和计算量的分布。

创新点2:

基于此框架,可以根据需求,自由设计不同尺度/规模的模型、重新分配计算资源,拥有极大的设计空间和灵活性。

创新点3:

与以往追求精度/速度的平衡不同,如空间金字塔或特征流,Scale-Time Lattice框架在时间上和空间上都是由粗到细的精细化操作。


1.3 实现步骤

1.3.1 框架整体流程

image-20220327135333412

框架运行流程:

–> 视频
–> 基于稀疏自适应关键帧的目标检测 (红点)
–> 获得质量好的边界框 (红框) 传播给后面的非关键帧 (第1行蓝框)
–> 跨尺度精细化 (绿框)
–> 更高尺度上,传播给非关键帧 (第2行蓝框)
–> 重新调节尺度精细化 (虚线箭头后的绿框)
–> 更高尺度上,传播给非关键帧 (第3行蓝框)

1.3.2 提升检测速度的原因

原因1:

只在稀疏的关键帧调用计算开销大的目标检测器,而不是逐帧检测。极大地降低了计算量。并且通过计算量小的传播网络保持了不错的检测精度。

原因2:

提出了2个新组件:更高效的时间上下文信息传播网络、自适应关键帧选择方案。

1.3.3 Scale-Time Lattice

Scale-Time Lattice框架流程图:每一行与上一幅图的一行对应。

image-20220327154619017

从横向来看,从左到右是时间轴。从纵向来看,从上到下是尺度规模逐渐增大。这个过程主要包括两个主要操作:时间上下文信息传播空间精细化。上图的水平箭头代表时间上下文信息传播;而竖直箭头代表空间精细化。检测结果在最底部的一行获得,最底部的一行的检查结果是最精细的,并覆盖了每一个非关键帧。


1.4 实验结果

1.4.1 实验条件

目标检测模型Faster R-CNN
主干网络ResNet-101
迭代次数200,000
显卡数量(张)8
数据集ImageNet VID 和 ImageNet DET

1.4.2 精度-帧率图

image-20220327150204360

该方法达到了 79.6 79.6 79.6 mAP( 20 20 20 fps)以及 79.0 79.0 79.0 mAP( 62 62 62 fps)。检测速度提高3倍的情况下,精度只下降了 0.6 0.6 0.6,可以说是非常具有竞争力了。

1.4.3 实际检测Demo

可以把下图实际检测与框架流程图对比着看:每行视频帧都对应框架流程图中的一行。

image-20220327145244243

image-20220327135333412

虽然第一行只有2帧调用了目标检测器,但从纵向来看,经过多次的 传播 --> 精细化 循环,就可以把关键帧的检测结果传送到两个关键帧中间的每一个非关键帧。这样即提升了检测速度,又维持了较好的检测精度。

1.4.4 计算量分布

image-20220327151224606

可见目标检测消耗的计算量比传播高2个数量级、比精细化高1个数量级。因此,应该尽可能选择检测的关键帧稀疏一点。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Mobile Edge Computing (MEC) is an emerging paradigm that enables computation and storage resources to be brought closer to the end-users in a wireless network. Unmanned Aerial Vehicles (UAVs) have been introduced in MEC systems to enhance network connectivity, coverage, and capacity. In this paper, we propose a novel approach to optimize the deployment of multiple UAVs in a three-dimensional space to minimize the task completion time in UAV-enabled MEC systems. We formulate the problem as a mixed-integer linear program (MILP), where the objective is to minimize the task completion time subject to resource constraints and safety regulations. The MILP considers the UAVs' positions, velocities, and orientations, as well as the task locations and requirements. We also consider the communication delay between the UAVs and the MEC servers and the energy consumption of the UAVs. To solve the MILP, we propose a two-stage algorithm that first generates an initial solution using a heuristic algorithm and then refines it using a local search algorithm. The heuristic algorithm generates a set of candidate solutions by selecting the UAVs' positions randomly and then optimizing the orientations and velocities to minimize the task completion time. The local search algorithm improves the solutions by iteratively moving the UAVs to nearby locations and checking if the task completion time is reduced. We evaluate the proposed approach using a simulation environment that mimics a real-world scenario. The results show that the proposed approach can significantly reduce the task completion time compared to the baseline approaches. Moreover, the proposed approach can adapt to the changes in the task requirements and the network conditions. In conclusion, the proposed approach can optimize the deployment of multiple UAVs in a three-dimensional space to minimize the task completion time in UAV-enabled MEC systems. The approach can be used in various applications, such as disaster response, surveillance, and precision agriculture.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

自牧君

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值