YOLO v3原理与代码解析

论文  https://arxiv.org/pdf/1804.02767.pdf

代码  https://github.com/qqwweee/keras-yolo3

Darknet 53

yolo v3借用了FPN特征融合的思想,但是又与Faster-Rcnn里的FPN不同,这里是通过concat的方式融合,faster-rcnn里则是通过add的方式。yolo v2中则是通过passthrough层实现网络浅层和深层特征的融合。

网络通过多尺度预测输出三个大小不同的预测,分别为13×13×255,26×26×255,52×52×255,这里255=3×(80+5)

y_true的shape为[(m, 13, 13, 3, 25), (m, 26, 26, 3, 25), (m, 52, 52, 3, 25)],其中m是batch size,25是voc数据集的class_num + 5, 5是4个坐标和1个置信度。9个anchor的大小为(10,13),  (16,30),  (33,23),  (30,61),  (62,45),  (59,119),  (116,90),  (156,198),  (373,326)。根据大小将9个anchor分配到三个不同的输出层,计算gt box与anchor的iou,注意这里只考虑形状,即将gt box和anchor的中心对齐后再计算iou,找到每个gt box对应iou最大的anchor,分配到y_true中对应的位置。

Loss

其中带*号的表示预测值,不带*号的表示标签。具体来说分为三个部分

  • 位置损失,xy损失是BCE loss,wh损失是MSE loss
  • 目标置信度损失,即obj loss,是BCE loss
  • 类别损失是BCE loss

其中在计算位置损失时,乘上了一个(2 - gt_w * gt_h)的系数,这里的gt_w和gt_h是归一化后的结果。这样会减小大目标的loss权重,增大小目标的loss权重,这样在一定程度上会防止小目标因为梯度太小而被直接丢弃的情况,起到和yolo v1中采用的平方根以降低boxes的大小对误差的影响同样的效果。

MMDetection中的yolo v3实现和官方的区别

  • 去掉了位置损失中的权重系数(2 - gt_w * gt_h)
  • 对于max_iou > thresh,但和gt不匹配的情况下,作为负样本。官方实现中是忽略其损失

参考

https://blog.csdn.net/dz4543/article/details/90049377

https://zhuanlan.zhihu.com/p/143106193

https://zhuanlan.zhihu.com/p/259487104

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Linux创始人LinusTorvalds有一句名言:Talk is cheap, Show me the code.(冗谈不够,放码过来!)。 代码阅读是从入门到提高的必由之路。尤其对深度学习,许多框架隐藏了神经网络底层的实现,只能在上层调包使用,对其内部原理很难认识清晰,不利于进一步优化和创新。  YOLOv3是一种基于深度学习的端到端实时目标检测方法,以速度快见长。YOLOv3的实现Darknet是使用C语言开发的轻型开源深度学习框架,依赖少,可移植性好,可以作为很好的代码阅读案例,让我们深入探究其实现原理。  本课程将解析YOLOv3的实现原理和源码,具体内容包括: YOLO目标检测原理  神经网络及Darknet的C语言实现,尤其是反向传播的梯度求解和误差计算 代码阅读工具及方法 深度学习计算的利器:BLAS和GEMM GPU的CUDA编程方法及在Darknet的应用 YOLOv3的程序流程及各层的源码解析本课程将提供注释后的Darknet的源码程序文件。  除本课程《YOLOv3目标检测:原理与源码解析》外,本人推出了有关YOLOv3目标检测的系列课程,包括:   《YOLOv3目标检测实战:训练自己的数据集》  《YOLOv3目标检测实战:交通标志识别》  《YOLOv3目标检测:原理与源码解析》  《YOLOv3目标检测:网络模型改进方法》 建议先学习课程《YOLOv3目标检测实战:训练自己的数据集》或课程《YOLOv3目标检测实战:交通标志识别》,对YOLOv3的使用方法了解以后再学习本课程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

00000cj

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值