论文地址1: https://arxiv.org/pdf/1804.02767.pdf
论文地址2:https://pjreddie.com/media/files/papers/YOLOv3.pdf
论文题目:YOLOv3: An incremental improvement
keras 实现:https://github.com/qqwweee/keras-yolo3
YOLOv3检测一张320×320的图像只需要22.2毫秒,mAP为28.2。其与SSD一样准确,但速度快了三倍,
mAP是什么?参考下面博客:
https://blog.csdn.net/weixin_38145317/article/details/89215780
网络结构:
DBL: 网络,代码中的Darknetconv2d_BN_Leaky,是yolo_v3的基本组件,就是卷积+BN+Leaky relu。
resn: n代表数字,有res1,res2,...,res8等等,表示这个res_block里有多少个res_unit.
concat:张量拼接,将darknet中间层和后面的某一层的上采样进行拼接,拼接的操作和参差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。
1.backbone: darknet-53
为了达到更好的分类效果,作者自己设计训练了darknet-53,作者在imagenet实验发现这个darknet-53,的确很强,相对于resnet-152和resnet-101,darknet-53不仅在分类精度上差不多,计算速度还比他们快多了,网络层数也比他们少。
不同于Darknet-19,yolo_v3使用了darknet-53的前面的52层(没有全连接层,除去最后一个FC),yolo_v3这个网络是一个全卷积网络,大量使用参差的跳层连接,并且