YOLO v3论文笔记(一)

本文详细介绍了YOLO v3的论文,包括YOLO v3的网络结构,如Darknet-53,以及多尺度预测机制。重点讨论了类别预测不再使用softmax而是采用logistic回归的原因,以及为何在损失函数中舍弃平方误差,转而采用交叉熵。同时,文中还解释了不同尺度特征图对应不同大小的先验框选择策略。
摘要由CSDN通过智能技术生成

论文地址1: https://arxiv.org/pdf/1804.02767.pdf

论文地址2:https://pjreddie.com/media/files/papers/YOLOv3.pdf

论文题目:YOLOv3: An incremental improvement

keras 实现:https://github.com/qqwweee/keras-yolo3

YOLOv3检测一张320×320的图像只需要22.2毫秒,mAP为28.2。其与SSD一样准确,但速度快了三倍,

mAP是什么?参考下面博客:

https://blog.csdn.net/weixin_38145317/article/details/89215780

网络结构:

DBL: 网络,代码中的Darknetconv2d_BN_Leaky,是yolo_v3的基本组件,就是卷积+BN+Leaky relu。

resn: n代表数字,有res1,res2,...,res8等等,表示这个res_block里有多少个res_unit.

concat:张量拼接,将darknet中间层和后面的某一层的上采样进行拼接,拼接的操作和参差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。

1.backbone: darknet-53

为了达到更好的分类效果,作者自己设计训练了darknet-53,作者在imagenet实验发现这个darknet-53,的确很强,相对于resnet-152和resnet-101,darknet-53不仅在分类精度上差不多,计算速度还比他们快多了,网络层数也比他们少。

不同于Darknet-19,yolo_v3使用了darknet-53的前面的52层(没有全连接层,除去最后一个FC),yolo_v3这个网络是一个全卷积网络,大量使用参差的跳层连接,并且

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值