- 将视觉跟踪任务分解成两个子任务:像素分类和边界框回归
- SiamCAR框架包含两个子网络:一个用于特征提取,一个用于预测边界框
- 使用ResNet-50作为主干网络
- 与其他的最先进的跟踪算法比较,本文提出的框架是描点自由和无提议区域,这样能够避免复杂的超参数调整和减少人工干涉
- 所提出的框架简单,有效
- 在现实生活中的跟踪,算法会受到光照变化,尺度变化大,背景干扰和严重遮挡问题
- 除上述外,非刚性的物体的形状或者外观会发生不可预知的变化
- Siamese网络将视觉跟踪任务定义为目标匹配问题,目的是学习目标模板和搜索区域之间的相似图
- 由于单个相似图像通常包含有限的空间信息,一种常见的策略实在搜索区域的多个尺度上进行匹配,以确定目标的尺度变化。但是这样也导致了一些追踪器费时费力
- 通过联合训练一个分类分支和一个回归分支用于跟踪,SiamRPN避免了耗时的步骤,并且也能够提取多尺度特征图的目标尺度不变性
- SiamRPN等网络将锚点引入到目标区域中,而跟踪器对描点较为敏感
- 为了引入描点自由,这篇论文将跟踪问题分解为:分类问题和回归问题
- 分类分支:目的是将每个像素预测为一个标签
- 回归分支:将每个位置回归为一个相对的包围框
- 经过这样分解后,可以以逐像素预测的方式解决跟踪任务
- SiamCAR旨在提取包含丰富类别信息和语义信息的响应图
- SiamCAR只使用一个响应图去预测物体的位置和包围框
- 代码使用在
SiamCAR: Siamese Fully Convolutional Classification and Regression for Visual Tracking 阅读记录
最新推荐文章于 2024-06-25 18:29:23 发布