Looking Fast and Slow: Memory-Guided Mobile Video Object Detection
未经作者允许,本文禁止转载
(一)论文地址:
https://arxiv.org/pdf/1903.10172.pdf
(二)核心思想:
本文讨论了,在计算机视觉系统中使用记忆模型是否可以提高视频流中目标检测的准确性,以及是否可以减少计算时间;
作者通过将传统的特征提取器(Slow Network),与只需要识别场景主旨的轻量级特征提取器(Fast Network)交叉使用,证明了在存在时间记忆模型的情况下,如何实现计算量最少的精确检测,并在手机等移动设备上实现了实时检测;
此外,作者还证明记忆模型包含足够的上下文信息,可以用来部署强化学习演算法来学习自适应推论策略;
(三)主要贡献:
这篇文章的主要贡献有:
• 提出了一个内存引导的交叉框架,其中多个特征提取器在不同的帧上