本周看了论文ThunderNet:Towards Real-time Generic Object Detection,走向实时目标检测。是ICCV2019的一篇论文,在此做下总结。
一、动机:在移动设备上实现实时通用目标检测。
问题:移动设备在计算量方面会受到严格的限制,现有的基于CNN的检测器需要大量的计算量去实现理想的检测率,这会阻碍在移动场景下的实时推断。
本文提出了一个轻量级两阶段检测器,命名为ThunderNet,该网络相较于其它先前轻量级检测器在准确率和效率方面都有很大的提升。文中提出了一阶段检测器和两阶段检测器间存在的较大的准确率差距,就此提出问题:两阶段检测器在实时检测上是不是能超过一阶段检测器,本文提出了一个专注于效率的两阶段检测器。
二、ThunderNet网络架构
1、骨干部分:文中提出一个轻量级骨干命名为SNet。SNet是在ShuffleNetV2网络的基础上进行修改得到的。
(1)输入分辨率:本文网络采用320x320的输入分辨率。输入分辨率应该与骨干网络的能力相匹配。
(2)骨干网络:感受野:大的感受野可以利用更多的上下文信息并且编码更大范围的像素间的联系。
早期和后期特征:在