代码:https://github.com/zengarden/light_head_rcnn
论文:https://arxiv.org/abs/1711.07264
旷视科技讲解:https://www.sohu.com/a/212814713_610300
2017年底旷视科技和清华提出的Light-Head RCNN[17]。精度跟yolov3类似时,速度为3倍。追求精度时COCO上最高mAP达到41.5%,超过mask-RCNN和Retinanet(ICCV2017 best student paper)。
通过使用一个稀疏的特征图(RoI之前,使用可分卷积内核缩小特征图维度到α × p × p, (α ≤ 10))和一个轻量的 R-CNN 子网络(池化和单全连接层),把网络的头部尽可能轻量化(就是把特征图的通道数从class降低到α ≤ 10)。
separable convolution可分离卷积说白了就是在inception v3模型提出的k ×k卷积分离成 k×1和1 ×k,这样可以显著降低卷积核的参数以及特征图的维度。
缺点:迁移的话,类别小于十个没啥优势。
ref
https://blog.csdn.net/Dlyldxwl/article/details/78714195
https://blog.csdn.net/zealoe/article/details/78606116