随记（8）：CVPR2021关于Tracking的论文速读(2)-11篇

最新推荐文章于 2023-08-23 10:14:47 发布

小白 AI 日记

最新推荐文章于 2023-08-23 10:14:47 发布

阅读量1.8k

点赞数

文章标签：磕磕绊绊

本文链接：https://blog.csdn.net/qq_37662375/article/details/122247319

版权

快放假了，心情顺畅，读论文也很“流畅”

Learning Dynamics via Graph Neural Networks for Human Pose Estimation and Tracking
1.提出了一种新的在线学习姿态动力学的方法，该方法独立于当前帧的姿态检测，因此可以结合当前帧的检测结果做出更优化的姿态估计
2.通过显式地考虑时空和视觉信息的图形神经网络(GNN)来推导这种动力学预测。模型将历史姿势轨迹作为输入，并直接预测每个轨迹在下一帧中的相应姿势。然后，预测的姿势将与检测到的姿势(如果有的话)在同一帧中聚合，从而产生最终姿势，潜在地恢复估计器遗漏的遮挡关节
3.致力于解决tracking-by-detection范式中严重依赖检测结果从而易受到遮挡，影响效果的问题
4.图网络相关

Learning to Filter: Siamese Relation Network for Robust Tracking
1.通过引入Relation Detector (RD) 和 Refinement Module (RM)两个模块以及对比训练策略来提升基于暹罗网络做跟踪任务的性能
2.RD模块是元学习的形式；RM就是两个并行的分类和回归CNN模块，放在RD模块后；既然存在少样本学习和元学习的相应模块，一般地也就会有对比学习存在

Learning to Fuse Asymmetric Feature Maps in Siamese Trackers
1.基于暹罗的跟踪器通常采用深度互相关(DW-XCorr)从两个特征映射(目标和搜索区域)获得多通道相关信息。但DW-XCorr在基于暹罗的跟踪中有几个局限性：它很容易被干扰物干扰(欺骗、混淆)，激活的通道较少，并且对对象边界的辨别能力较弱。此外，DW-XCorr是一个手工制作的无参数模块，不能完全受益于大规模数据的离线学习。
2.提出了一个可学习的模块，称为非对称卷积(ACM)，它在大规模数据的离线训练中学习更好地捕捉语义关联信息。
3.与DW-XCorr及其前身(XCorr)将单个特征映射作为卷积核不同，该ACM将拼接的特征映射上的卷积运算分解为两个数学上等价的运算，从而避免了拼接时特征映射的大小(宽度和高度)相同的要求。ACM可以将有用的先验信息(如边界框大小)与标准视觉功能结合起来。此外，ACM可以很容易地集成到现有的基于DW-XCorr或XCorr的暹罗追踪器中。

LightTrack: Finding Lightweight Neural Networks for Object Tracking via One-Shot Architecture Search
NAS的工作先不做过多了解

MeanShift++: Extremely Fast Mode-Seeking With Applications to Segmentation and Object Tracking
1.意在升级MeanShift算法
2.使用基于网格的方法来加速Mean Shift步骤，用相邻网格单元的密度加权平均值代替计算量较大的邻居搜索
3.更重要的证明这种基于网格的方法是科学的，并给出了理论证明

Multiple Object Tracking with Correlation Learning
1.提出利用局部相关模块来建模目标与周围环境之间的拓扑关系，从而增强了模型在拥挤场景中的分辨能力
2.可分为三个阶段：(1)一般特征提取，(2)从时空相关性中学习相关性并同时预测检测，(3)进行数据关联，将检测分配到它们最可能的轨迹，其中阶段(1)和阶段(2)是可区分的，并组成端到端可训练的体系结构
3.是一种DeepSORT框架和Transformer注意力机制的结合
4.同时也是在Patch based feature extraction基础上的工作

Online Multiple Object Tracking with Cross-Task Synergy
1.是Trackor++的改进工作
2.通常的预测方法很少考虑物体之间的相互作用，因此在处理遮挡问题时，位置预测本身就不够强大。在遮挡较重的情况下进行预测通常会导致边界框漂移，即目标的预测位置开始跟随邻近对象。然后，由于错误预测的边界框，提取的用于关联的嵌入恶化。这可能导致在连续帧上传播的关联错误。在这种情况下，预测会损害关联嵌入，而不是帮助。同时，单独改进嵌入只能减少关联阶段的误差，这无助于直接防止位置预测误差。
3.将这两项任务协同优化
4.通过使用注意力机制完成

Polygonal Point Set Tracking
1.提出了一种新的基于学习的多边形点集跟踪方法。与现有的传播像素化对象掩码信息的视频对象分割方法不同的是，该文在帧上传播多边形点集
2.与追踪人体关键点有些不同

Probabilistic Tracklet Scoring and Inpainting for Multiple Object Tracking
1.引入了一种概率自回归运动模型，通过直接测量轨迹提案的可能性来对其进行评分
2.通过训练模型来学习自然轨迹的基本分布来实现的。
3.这样的模型不仅允许将新的检测分配给现有的轨迹，而且还允许在对象长时间丢失(例如，由于遮挡)时，通过采样轨迹来填充轨迹，以填补错误检测造成的空白
4.比较有意思的是还可以从轨迹的角度去反馈跟踪方法本身

Progressive Unsupervised Learning for Visual Object Tracking
1.提出一种用于跟踪的渐进式无监督学习框架
2.步骤是：对比学习->学习一种背景判别模型->挖掘连续帧中的时间对应补丁->抗躁损失函数->学习时间对应关系->主干用暹罗网络

Quasi-Dense Similarity Learning for Multiple Object Tracking
1.提出密集相似性学习
2.以前的方法只使用稀疏的ground truth作为训练目标，而忽略了图像上的大部分信息区域
3.除了稀疏分布在图像上的地面事实和检测到的包围盒之外，许多可能的目标区域可以提供有价值的训练监督。它们要么接近真实边界框以提供更多正面训练示例，要么在背景作为负面示例。
4.因此提出准密集相似学习，它在一对图像上密集地匹配数百个感兴趣的区域进行对比学习。准密集样本可以覆盖图像上的大部分信息区，提供更多的box样本和hard negatives。

小白 AI 日记

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
1
评论
随记（8）：CVPR2021关于Tracking的论文速读(2)-11篇

Learning Dynamics via Graph Neural Networks for Human Pose Estimation and Tracking 1.提出了一种新的在线学习姿态动力学的方法，该方法独立于当前帧的姿态检测，因此可以结合当前帧的检测结果做出更优化的姿态估计 2.通过显式地考虑时空和视觉信息的图形神经网络(GNN)来推导这种动力学预测。模型将历史姿势轨迹作为输入，并直接预测每个轨迹在下一帧中的相应姿势。然后，预测的姿势将与检测到的姿势(如果有的话)在同一帧中聚合...
复制链接

扫一扫