总而言之,普通的检测器由以下几个部分组成:
- 输入:图像,斑块,图像金字塔
- backbone:
- VGG16 [68],ResNet-50 [26],SpineNet [12],EfficientNet-B0 / B7 [75],CSPResNeXt50 [81],CSPDarknet53 [81]
- neck:
- 其他块:SPP [25],ASPP [5],RFB [47],SAM [85]
- 路径聚合块:FPN [44],PAN [49],NAS-FPN [17] ],Fully-connected FPN,BiFPN [77],ASFF [48],SFAM [98]
- Heads :
密集预测(一阶段):
RPN[64],SSD [50],YOLO [61], RetinaNet [45](基于锚)
CornerNet[37],CenterNet [13],MatrixNet [60],FCOS [78](无锚)
- 稀疏预测(两阶段):
- Faster R-CNN [64],R-FCN [9],Mask R-CNN [23](基于锚)
- RepPoints[87](无锚)
参考资料
https://zhuanlan.zhihu.com/p/136290191