1.
darknet-53是说backbone中有53层卷积层
2.因为全部用3*3 stride = 2 的卷积层来完成下采样 而不是池化层 所以准确率高; 而resnet中卷积核个数远多于darknet53 所以速度快
3.
4.上图中 13*13检测的是大尺度图片 而26*26 和52*52因为分别经过了一次/两次上采样,所以获得了更多细粒度的特征信息 所以分别用于 检测中等图片和小图片 (此处听的不是很懂)
1.
darknet-53是说backbone中有53层卷积层
2.因为全部用3*3 stride = 2 的卷积层来完成下采样 而不是池化层 所以准确率高; 而resnet中卷积核个数远多于darknet53 所以速度快
3.
4.上图中 13*13检测的是大尺度图片 而26*26 和52*52因为分别经过了一次/两次上采样,所以获得了更多细粒度的特征信息 所以分别用于 检测中等图片和小图片 (此处听的不是很懂)