随记（6）：CVPR2021关于Tracking的论文速读(1)-12篇

最新推荐文章于 2023-11-20 10:44:24 发布

小白 AI 日记

最新推荐文章于 2023-11-20 10:44:24 发布

阅读量2.9k

点赞数

文章标签：磕磕绊绊

本文链接：https://blog.csdn.net/qq_37662375/article/details/121956698

版权

写在前面：结构都是论文做了什么、怎样做的、以及为什么要这样做

正文

Alpha-Refine
1.做了一个即插即用的模块，可直接添加到现有的跟踪器上，精细box
2.论文认为对于一个跟踪器box的精细化很重要，但现有方法做不到这点
3.提出精细化的关键是尽可能多地提取和维护详细的空间信息。所以采用逐像素相关、角点预测头和辅助掩码作为核心部件设计了一个模块。

CapsuleRRT
1.用胶囊网络做回归跟踪
2.提出胶囊网络更易建模跟踪目标各部分之间的关系，就是说遮挡问题更容易被解决
3.结构类似于Trackor++的结构，网络主干使用胶囊网络

CenterPoint
1.提出将3D点云中的目标表示为点的形似并首先使用KeyPoint检测器回归点的其他属性，如3D大小、3D方向、速度等
2.3D世界中的box不遵循任何特定的方向，基于box的检测器难以枚举所有方向或将轴对齐的边界框适合旋转的对象
3.关键点估计网络形式-估计关键点-MLP层回归其他属性

multi-track pooling
1.通过利用场景中完整轨迹集的外观信息，利用场景中其他轨迹的外观信息来增强分类器的内存，从而提高这种分类器的预测可能性。所得到的分类器学习基于来自场景中其他轨道的信息来调整其预测。
2.用LSTM来做这件事，话说要求有记忆部分存在的其实都是使用LSTM来完成
3.现有的基于递归神经网络的航迹分类器在跟踪过程中只使用匹配检测来更新其外观记忆。这不考虑场景中的其他对象(即反例)，这些对象可能具有相似的外观

DMTrack
1.该文着重考虑了跟踪器中的干扰因素，并提出解决方案
2.该文认为之前的跟踪器对干扰感知问题都没有专门考虑过或者考虑不周
3.利用两个核心组件(即单次检测和重新识别(Re-id)关联)，通过动态卷积(d-cvs)和多目标跟踪(MOT)的思想来实现干扰感知的快速跟踪

DyGLIP
1.提出一个动态图模型解决多相机多目标跟踪问题
2.动态图模型
3.光照条件不一致，物体运动模式变化，或者相机之间物体的轨迹遮挡，开发一个健壮的MC-MOT系统仍然是非常具有挑战性

GMOT-40
1.基线类文章需要做的工作比较多:构建了第一个公开可用的密集GMOT数据集，称为GMOT-40，它包含40个仔细注释的序列，均匀分布在10个对象类别中。此外，还采用了两种跟踪协议来评估跟踪算法的不同特性;针对目前缺乏专门的跟踪算法的问题，设计了一系列基线GMOT算法;对GMOT-40进行了全面的评估，包括流行的MOT算法(经过必要的修改)和建议的基线。
2.做数据集的常规思路
3.为什么要做，这里给的理由是：现有的研究主要要求跟踪目标(如行人)的先验知识，因此可能不能很好地推广到看不见的类别。相比之下，一般的多目标跟踪(GMOT)几乎不需要关于目标的先验信息，因此在很大程度上没有得到充分的探索

SiamGAT
1.提出了一种简单的目标感知暹罗图注意力网络，用于一般目标跟踪
2.这是一个图、暹罗网络、注意力机制的集合体
3.该文认为由于Siam类网络由于需要预先确定目标特征区域的大小，这些互相关基方法要么保留了大量不利的背景信息，要么丢失了大量的前景信息。此外，目标和搜索区域之间的全局匹配也在很大程度上忽略了目标结构和局部级别的信息

SOTMOT
1.提出一个应用单目标检测完成多目标检测的模型
2.在CenterNet的基础上加入三个并行的分支分别生成对象中心热图、偏移量和box。另外在CenterNet后额外加入一个SOT分支通过利用CenterNet输出特征构建SOTMOT
3.大目标检测系统很快且准确率较好，但是不能直接扩展到多目标跟踪任务中

TMOH
1.提出一种新的遮挡处理策略，显式地建模遮挡与轨迹之间的关系；提出一个轨迹管理策略
2.通过NMS和motion model (MM) and
a camera motion compensation (CMC) 来做这件事
3.现有的ReID处理暂时遮挡的方法通常是从新的检测中提取视觉特征，并将它们与先前发现的轨迹的特征进行比较。由于重叠(尤其是拥挤情况下)现象存在，现有方法表现不理想

IoU Attack
这篇是攻击跟踪器的论文，之前没接触过，待我读一读相关论文再总结

Learnable Graph Matching
1.提出一种新的可学习图匹配方法来解决这些问题。简而言之是将Tracklet和帧内检测之间的关系建模为一般的无向图。然后将关联问题转化为轨迹图与检测图之间的一般图匹配问题。
2.图网络
3.原因有三：1)现有的跟踪方法大多忽略了跟踪器和帧内检测之间的上下文信息，这使得跟踪器在严重遮挡等挑战性情况下很难生存。2)端到端关联方法仅依赖于深度神经网络的数据拟合能力，而没有充分利用基于优化的分配方法的优势。3)基于图的优化方法大多使用单独的神经网络来提取特征
4.此外还有一篇：Learning a Proposal Classifier for Multiple Object Tracking也是图网络