目标检测模型组件构成1
目标检测架构通常具有共同的组件,这些组件大致可以概括成一下几类。
1. Backbone:
Backbone是用于将图像转换为特征映射的部分,比如去掉最后一层全连接层的ResNet-50。
2. Neck
连接backbone和head。Neck用于优化改进和重新配置backbone产生的原始特征数据。例如特征金字塔网络(FPN)。
3. DenseHead(AnchorHead/AnchorFreeHead)
DenseHead用于操作特征映射的密集位置,包括AnchorHead 和 AnchorFreeHead。
4. RoIExtractor
RoIExtractor是使用RoIPooling-like操作符从单个或多个特征映射中提取RoI-wise特征的部件。从相应级别的特征金字塔中提取RoI特征的一个示例是SingleRoIExtractor.
5. RoIHead (BBoxHead/MaskHead)
将RoI特征作为输入,并进行RoI-wise具体任务的预测,如边界框分类/回归、掩码预测。
单阶段和两阶段检测器框架如下图所示,可以通过简单地创建一些新的组件和组装现有的组件来开发我们自己的方法。
Reference
Chen, Kai, Jiaqi Wang, Jiangmiao Pang, Yuhang Cao, Yu Xiong, Xiaoxiao Li, Shuyang Sun, 等. 《MMDetection: Open MMLab Detection Toolbox and Benchmark》. ArXiv:1906.07155 [Cs, Eess], 2019年6月17日. http://arxiv.org/abs/1906.07155. ↩︎