YOLOV3 原理

Yolo V3的关键技术:
在这里插入图片描述

  • V3改进的出发点是检测效果,最大的改进就是网络结构,更适合小目标检测
  • 特征做的更细致,利用不同层的征图信息来预测不同规格物体
  • 先验框更丰富了,3种scale,每种3个规格,一共9种
    yolov1版本有2种先验框,v2版本有5种先验框,v3版本有9种先验框
  • softmax改进,预测多标签任务,每个种类都作为二分类

YOlO V3 多Scale
为了能检测到不同大小的物体,设计了3个scale特征图,1313,2626,52*52分别预测大,中,小三个目标。在每一种scale上产生三种box,一共产生9种候选框。

在这里插入图片描述核心网络架构

  • 没有池化和全连接层,全部卷积
    池化层压缩了特征,影响效果。
  • 下采样通过stride为2实现,
    通过卷积的stride为2 实现了下采样。
  • 3种scale,更多先验框
  • 基本上当下经典做法全融入了(引入了Res block)

在这里插入图片描述

多scale特征图是怎么得到的呢?

  • 网络输入尺寸是416,通过32倍下采样得到了13*13 特征图。
  • 网络输入尺寸是416,通过16倍下采样,得到了2626特征图,并且再融合1313上采样到26*26的特征。
  • 网络输入尺寸是416,通过8倍下采样,得到了5252特征图,并且再融合2626上采样到52*52的特征。

YOLOv3网络输出

  • YOLOv1的网络输出是772(4+1+80)
  • YOLOv2的网络输出是13135(4+1+80)
  • YOLOv3的网络输出是有三部分组成,分别是:13133*(4+1+80), 26263*(4+1+80) 和 52523(4+1+80)

在这里插入图片描述先验框设计

  • YOLOV1 用了YOLOV2中选了5个,Yolov3,一共有9种
  • 13 ∗ 13 13*13 1313特征图上:(116x90),(156x198),(373x326)
    26 ∗ 26 26*26 2626特征图上:(30x61),(62x45),(59x119)
    52 ∗ 52 52*52 5252特征图上:(10x13),(16x30),(33x23)

类别预测

yolov3不再使用softmax,作为内别预测,而只是使用独立的logistic分类器。在训练期间,我们使用二元交叉熵损失进行类预测。
在迁移到更复杂的领域(如Open Images Dataset)时,此方法会有所帮助。在此数据集中有许多重叠标签(即女人和人)。使用softmax假设每个框只有一个类,而通常不是这种情况。多标签方法可以更好地模拟数据。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux创始人LinusTorvalds有一句名言:Talk is cheap, Show me the code.(冗谈不够,放码过来!)。 代码阅读是从入门到提高的必由之路。尤其对深度学习,许多框架隐藏了神经网络底层的实现,只能在上层调包使用,对其内部原理很难认识清晰,不利于进一步优化和创新。  YOLOv3是一种基于深度学习的端到端实时目标检测方法,以速度快见长。YOLOv3的实现Darknet是使用C语言开发的轻型开源深度学习框架,依赖少,可移植性好,可以作为很好的代码阅读案例,让我们深入探究其实现原理。  本课程将解析YOLOv3的实现原理和源码,具体内容包括: YOLO目标检测原理  神经网络及Darknet的C语言实现,尤其是反向传播的梯度求解和误差计算 代码阅读工具及方法 深度学习计算的利器:BLAS和GEMM GPU的CUDA编程方法及在Darknet的应用 YOLOv3的程序流程及各层的源码解析本课程将提供注释后的Darknet的源码程序文件。  除本课程《YOLOv3目标检测:原理与源码解析》外,本人推出了有关YOLOv3目标检测的系列课程,包括:   《YOLOv3目标检测实战:训练自己的数据集》  《YOLOv3目标检测实战:交通标志识别》  《YOLOv3目标检测:原理与源码解析》  《YOLOv3目标检测:网络模型改进方法》 建议先学习课程《YOLOv3目标检测实战:训练自己的数据集》或课程《YOLOv3目标检测实战:交通标志识别》,对YOLOv3的使用方法了解以后再学习本课程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值