idea
引入历史帧共同对search响应,变成了多template一search,
相应地有模板更新的策略,就是论文里那个选历史帧的公式,我比较认可他 始终取第一帧,以及上一帧这个想法,因为上一帧一定是离当前帧很近的,这种相邻帧之间的响应应当非常大,而第一帧则始终保持为我们提供绝对正确可靠的信息
引入了centerness中心度的概念,来源于目标检测fcos,
这样去筛选rpn提出来的anchor会更高质量,即centerness会抑制那种离物体中心比较远的锚点,也就是帮助那些与物体中心非常接近锚点,这些锚点最终产生的框肯定也更好
还有一点就是每一张历史帧的掩膜图也参与了训练卷积的过程