参考:https://www.flyai.com/article/778
https://blog.csdn.net/justsolow/article/details/106401065
创新点:
(1)输入端:Mosaic数据集,cmBN,SAT自对抗训练。
(2)BackBone:CSPDarknet 53,Mish激活函数,Dropblock。
(3)Neck:SPP,FPN+PAN结构。
(4)Prediction:GIou Loss,DIou Loss。
1.OD相关结构
Object Detection = Backbone + Neck + Head
1.1.Input
算法的输入,包括整个图像,一个batch,或者是image pyramid
1.2.Backbone
可以理解为是提取图像特征的部分,由于图像中的浅层特征(low-level)是比较类似的,例如提取边缘,颜色,纹理这些。因此这部分可以很好的借鉴一些设计好并且已经训练好的网络,例如(VGG16,19,ResNet-50, ResNeXt-101, Darknet53), 同时还有一些轻量级的backbone(MobilenetV1,2,3 ShuffleNet1,2)。
1.3.Neck
特征增强模块,前面的backbone已经提取到了一些相关的浅层特征,由这部分对backbone提取到的浅层特征(low-level feature)进行加工,增强,从而使得模型学到的特征是我想要的特征。这部分典型的有(SPP,ASPP in deeplabV3+,RFB,SAM),还有一些(FPN, PAN, NAS-FPN, BiFPN, ASFF, SFAM)。
1.4.Head
检测头。这部分就到了算