2022多目标跟踪论文阅读总结

最新推荐文章于 2024-06-20 14:10:36 发布

DCGJ666

最新推荐文章于 2024-06-20 14:10:36 发布

阅读量1.4k

点赞数 3

分类专栏：深度学习文章标签：目标跟踪论文阅读人工智能

本文链接：https://blog.csdn.net/DCGJ666/article/details/125255994

版权

深度学习专栏收录该内容

39 篇文章 1 订阅

订阅专栏

2022多目标跟踪论文阅读总结

TCTrack:Temporal Contexts for Aerial Tracking（单目标跟踪）
Global Tracking Transformers
- 主要内容
- Motivation
Learnable Graph Matching: Incorporating Graph Partitioning with Deep Feature Learning for Multiple Object Tracking
- 主要内容
- 方法
GIAOTracker: A comprehensive framework for MCMOT with global information and optimizing strategies in VisDrone 2021
OC-SORT
Tracking Objects as Pixel-wise Distributions
Towards Grand Unification of Object Tracking

TCTrack:Temporal Contexts for Aerial Tracking（单目标跟踪）

主要内容

利用时间帧信息进行跟踪。时间上下文包含在两个层面上：1.特征的提取；2.相似性映射的细化。
在特征提取方面，提出了一种在线时间自适应卷积的方法，利用时间信息，通过根据前一帧动态校准卷积权值来增强空间特征。（思考：时间维度上的deformable 卷积）
相似图的细化，提出一种自适应时间转化器，它首先有效地编码时间只是，然后解码时间以精确调整相似图。

Motivation

无人机拍摄不可避免地会带来运动模糊、摄像机运动，遮挡等特殊挑战
空中平台的有限功率限制了计算资源，阻碍了耗时的先进方法的部署。

Method

在这里插入图片描述

TAdaCNN

在这里插入图片描述
卷积的特征变为时间帧特征的cat。再经过两个1x1卷积分别得到权值和偏置。
其中pooling为全局平均池化。同时，如果前面没有足够的帧进行时间动态卷积，则用前一帧进行填充。
采用3D卷积实现的时间维度卷积

AT-Trans

根据时间上下文细化相似度映射Ft。
在这里插入图片描述
貌似就是常规的transformer的结构。以当前帧Ft作为V,K，之前帧作为查询帧。

Global Tracking Transformers

作者是centernet和centertrack

主要内容

以一个短时间的帧序列作为输入，为所有对象生成全局轨迹。利用transformer对所有帧中的对象特征进行编码，并使用轨迹查询将它们分组为轨迹。GTT可以不需要中间的成对分组或组合训练，并且可以与一个目标检测器联合训练。

Motivation

在这里插入图片描述
成对的关联是有效的，但是缺乏一下明确的整体轨迹模型，有时会与严重的遮挡或强烈的外观变化导致失败。全局跟踪器对成对关联运行离线的基于图的组合优化。它们可以解决不一致的分组检测，而且更健壮，但可能速度较慢，通常与检测器分离。

Learnable Graph Matching: Incorporating Graph Partitioning with Deep Feature Learning for Multiple Object Tracking

图匹配解决多目标跟踪问题：轨迹图与检测图之间的一般图匹配。

主要内容

在这里插入图片描述

这个问题的传统方法对闭塞并不可靠，然后根据最小代价流问题的最优解导出最佳关联。现有工作集中于寻找帧之间的最佳匹配，但忽略了框架内的上下文。
这篇文章注重同一帧目标与目标形成的图结构。

方法

首先对检测图和轨迹图进行匹配，图的匹配问题是使匹配的顶点与由这些顶点连接的对应边之间的相似性最大化。
优化的目标：最大化所有匹配顶点之间的顶点亲和度，并最小化所有匹配边之间的边权值的差异。
在这里插入图片描述

提取检测帧的全连接图，特征为reid
提取跟踪帧的全连接图，特征为reid的平均
对两个图进行图匹配

GIAOTracker: A comprehensive framework for MCMOT with global information and optimizing strategies in VisDrone 2021

为了缓解检测噪声，提出了一种新的特征存储和更新策略EMA bank,以同时保持不同的特征转态和特征变化的信息。在目标运动建模方面，线性卡尔曼滤波算法是广泛使用，它简单地设置一个统一的测量噪声尺度到所有目标，而不考虑检测质量。为了获得更精确的运动状态，提出了一种噪声尺度自适应卡尔曼滤波算法，该算法根据目标检测的质量自适应调制噪声尺度。
在这里插入图片描述
ps:这文章里trick好多，不愧是比赛论文。

OC-SORT

改进卡尔曼滤波，将其改为以测量值为主，而不是观测值为主。

Tracking Objects as Pixel-wise Distributions

不同于之前的跟踪器，以边界框或者点作为跟踪对象，这篇文章建议跟踪对象作为像素级分布。

采用dense feature propagation在帧间传播信息。（Flow-guided feature aggregation for video object detection）
采用meta-architecture生成对象建议区域
采用masked attention跟踪局部跟踪结果，避免背景噪声。（Maskedattention mask transformer for universal image segmentation）

主要工作

在这里插入图片描述

Masked-attention Mask Transformer for Universal Image Segmentation

对应上述工作中的解码阶段
在这里插入图片描述

Flow-Guided Feature Aggregation for Video Object Detection

在这里插入图片描述

Towards Grand Unification of Object Tracking

统一目标跟踪的四个任务：
SOT：单目标跟踪
VOS：视频目标实例跟踪
MOT：多目标跟踪
MOTS：多目标实例跟踪
在这里插入图片描述
相邻帧交互用的deformable detr.

DCGJ666

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
2022多目标跟踪论文阅读总结

为了缓解检测噪声，提出了一种新的特征存储和更新策略EMA bank,以同时保持不同的特征转态和特征变化的信息。成对的关联是有效的，但是缺乏一下明确的整体轨迹模型，有时会与严重的遮挡或强烈的外观变化导致失败。，提出了一种在线时间自适应卷积的方法，利用时间信息，通过根据前一帧动态校准卷积权值来增强空间特征。首先对检测图和轨迹图进行匹配，图的匹配问题是使匹配的顶点与由这些顶点连接的对应边之间的相似性最大化。2.相似性映射的细化。：最大化所有匹配顶点之间的顶点亲和度，并最小化所有匹配边之间的边权值的差异。
复制链接

扫一扫

专栏目录