首次展示了一种基于query-key机制的简单有效的方法,在MOT17上实现65.8%的MOTA,代码刚刚开源!
PS:目前看来,目标检测、实例分割、语义分割主流CV方向均被Transformer"攻克"了,这篇是多目标跟踪,但似乎单目标跟踪还没被Transformer"攻克"(等看谁家手速快,且work了)
注:文末附【目标跟踪】和【Transformer】交流群
TransTrack: Multiple-Object Tracking with Transformer
- 作者单位:港大(罗平团队), 字节AI Lab, 同济, CMU, 南洋理工大学
- 代码:https://github.com/PeizeSun/TransTrack
- 论文:https://arxiv.org/abs/2012.15460
TransTrack
多目标跟踪(MOT)主要由复杂的多步tracking-by-detection算法控制,该算法分别执行目标检测,特征提取和时间关联。
单目标跟踪(SOT)中的query-key机制通过前一帧的对象特征跟踪当前帧的对象,具有建立简单的联合检测和跟踪MOT范例的巨大潜力。但是,由于query-key方法无法检测到新出现的对象,因此很少进行研究。