目录
YOLOv3对YOLOv2的改进:
1.loss不同:作者v3替换了v2的softmax loss变成logistic loss,由于每个点所对应的bounding box少并且差异大,每个bounding与ground truth的matching策略变成了1对1.
2.anchor bbox porior不同:v2的作者用了5个先验框,v3用了9个先验框,提高了IOU
3.detection的策略不同:v2只有一个detection,v3一下子变成了3个,分别是一个下采样的,feature map为13×13,还有2个上采样的eltwise sum,feature map为26×26,52×52,也就是说v3的416版本已经用到了52的feature map,而v2把多尺度考虑到训练的data采样上,最后也只是用到了13×13的feature map,这应该是对小目标影响最大的地方。
4.backbone不同:采用简化的residual block取代了1×1和3×3的block(其实就是加了一个shortcut,也是网络加深必然所要采取的手段。),这和上一点是有关系的,v2的darknet-19变成了darknet-52,需要上采样,卷积层数自然就多了,另外坐着还是用了一连串的3×3、1×1卷积,3×3卷积增加channel,而1×1卷积在于压缩3×3卷积后的特征表示,这波操作很具有实用性,一增一减,效果很棒。
5.对小