复现Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking 遇到的一些问题
1.训练数据集分两种格式
1.1. 检测格式
- 这个格式一张图片等同一个序列, 然后采样应该需要序列时序关系的网络 ,所以一次采样3张都是同一张同一个bbox
1.2. 跟踪格式
- 数据有最短限制, 不能为1 , 唯一的话无法采样 会报错
- 什么range (0,0,0) 的错误
2.将跟踪器应用到更加困难的场景
2.1.场景一定要足够复杂, 且数据量要大, 不然序列容易过拟合
-
这个我还有一些问题
-
Q 是否可以整合自己的数据集和现有数据集, 作为训练集来避免过拟合?
3.单目标跟踪的定义
跟踪任意类别 任意场景下的给定目标的轨迹.可能的挑战有
- Illumination Variation,Scale Variation,Occlusion,Deformation,Motion Blur,Fast Motion,In-Plane Rotation(跟踪目标旋转),Out-of-Plane Rotation(跟踪目标旋出了场景),Out-of-View,Background Clutters,Low Resolution
3.1. 跟踪难题
要跟踪的目标物体 和背景物体高度相似 , 且目标之间有交互
4.其他
过拟合一般原因
- 数据集量过小
过拟合场景solution
- 正则化,dropout,eary stop ,
- 集成学习(用简单的模型 来解决这个问题)
- 扩充数据集
- 减少网络层数,降低网络复杂度
- 数据增强
- 就是通过flip , crop,rotate ,make it gray 等方式变出不同的图像 ,扩充原有数据集