ICCV2019 | 旷视提出轻量级目标检测网络ThunderNet
本文作者:Liyang
作者学校:复旦大学
论文地址:https://arxiv.org/pdf/1903.11752.pdf
源码地址:https://github.com/mohhao/TF-Keras-ThunderNet
论文作者:Zheng Qin, Zeming Li, Zhaoning Zhang, Yiping Bao, Gang Yu, Yuxing Peng, Jian Sun(megvii旷视科技)
本文将对ICCV2019会议论文《ThunderNet:Towards Real-time Generic Object Detection》进行解读,这篇论文在目标检测领域取得了比较好的成果,作者在Shufflenet v2和Lighthead r-cnn基础上,提出了一种新的SNet主干,进一步压缩 RPN和检测头,并设计了独特的CEM和SAM模块,在轻量化和精度上均有出色的表现。
ThunderNet的整体结构
输入为320x320分辨率,整体结构分成名为SNet的轻型Backbone(主干)和Detection(检测)部分。
主干部分(Backbone Part)
ThunderNet输入分辨率(Input Resolution)。作者采用320*320的分辨率,目的是提高推理速度。作者通过实验分析,一方面,小分辨率图像会丢失较多的细节特征,很难通过增加主干网络的容量来弥补,如SNet535(输入分辨率192x192)超过SNet146(分辨率320x320)8.2%的算力,但AP反而下降了14%;另一方面,小主干网络太弱,很难满足大尺寸图像的编码需要,如SNet48(分辨率480x480)即使算力超过了SNet146(分辨率320x320),但仍然明显低于后者的AP;因此,作者认为输入分辨率和主干网络应该匹配。