目标检测和跟踪的区别在于: 对运动中发生变化的目标的跟踪能力
-
理想的检测器不行、理想的跟踪器却可以
设想这样一个场景:孙悟空在飞行过程中完成了一次变化(这里假设他变成了一只鸟),但这个变化并不是像西游记拍摄中有烟雾特效完成的,而就是通过身体结构发生渐变来完成的,这种情况下,检测器应该会在后续的检测任务中失败,因为设计好的检测器只是为了检测目标孙悟空的存在,孙悟空变身之后已经不存在这个目标,检测器是不会有火眼金睛继续检测到变化后的孙悟空的。但是,对于跟踪器就不一样了,跟踪目标,哪怕目标在跟踪过程中发生了巨大变化,这些都是跟踪器的本质能力。理想的跟踪器应该可以很好的跟上孙悟空渐变的整个过程,并且可以继续后面变身之后对鸟的跟踪。
将检测用于跟踪方向需要思考
- 跟踪的本质是根据帧间的关系来推测运动目标的轨迹。将检测用于跟踪,只是偷懒将已有的技术直接拿来做了简单目标的特定条件下的跟踪,并不是一个良好的跟踪器的性能
- 理想的跟踪器应该不需要每一帧都暴力检测目标所在的位置,而是可以充分利用帧间信息,目标周围的环境信息,甚至根据周边环境推测得到的三维信息等,更加高效的确定目标所在的位置。理想的跟踪器应该可以对视频中的目标运动,周边环境有着更好的理解,这个理解不一定是和我们理解一致的语义理解,而是有助于跟踪任务的相关理解。
- 检测语义的目标再做实例的分类未免复杂化了