【6】目标检测之YOLO v3

mohoooooo

已于 2022-04-20 20:46:05 修改

阅读量1.2k

点赞数

分类专栏：深度学习目标检测文章标签：深度学习

于 2022-04-20 17:11:21 首次发布

本文链接：https://blog.csdn.net/qq_16009377/article/details/124300396

版权

深度学习同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

目标检测

9 篇文章 0 订阅

订阅专栏

这里写目录标题

改进
网络结构
知识点
损失函数

改进

Darknet-53

骨干网络采用Darknet-53 的网络结构，含有53个卷积层，增加了残差结构。
在这里插入图片描述

多尺度特征图预测

YOLO v3 更进一步采用了 3 个不同尺度的特征图来进行对象检测，可以参考下面的网络结构图，通过聚类的方法生成了9种先验框(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。
在最小的 13 * 13 特征图上（有最大的感受野）应用较大的先验框(116x90)，(156x198)，(373x326)，适合检测较大的对象。中等的 26 * 26 特征图上（中等感受野）应用中等的先验框(30x61)，(62x45)，(59x119)，适合检测中等大小的对象。较大的 52 * 52 特征图上（较小的感受野）应用较小的先验框(10x13)，(16x30)，(33x23)，适合检测较小的对象。
在这里插入图片描述
原文链接：https://blog.csdn.net/m0_45962052/article/details/105199178

正负样本匹配

正样本匹配：对每一个GroundTruthBox,取IOU最大的先验框作为正样本，剩余的先验框中，IOU>0.5的既不是正样本，也不是负样本，剩余的是负样本，不用于计算损失。正样本用于计算coordinate损失、confidence损失、class prediction损失，负样本只计算confidence损失。
在这里插入图片描述

边界框计算公式优化

在这里插入图片描述

网络结构

在这里插入图片描述

知识点

损失函数

YOLO v3的损失函数包括coordinate损失、confidence损失、class prediction损失， $I^{obj}_{ij}$ 表示负责第i个网格的第j个先验框是否负责这个object，是的话 $I^{obj}_{ij}$ =1，否则 $I^{obj}_{ij}$ =0。
那么什么叫做负责呢？当一个先验框是相较于所有的先验框是与该obj的GT Box的IOU最大，即该先验框为正样本时，这个先验框是负责这个object。
$I^{noobj}_{ij}$ 表示当前先验框是不负责这个object。

论文中是这么规定正负样本的，但是我看代码是，只要目标所在网格产生的9个先验框中和目标的真实框的iou大于阈值的就为正样本，如果都小于阈值，那么和目标iou最大的为正样本。

原文链接：https://blog.csdn.net/weixin_43384257/article/details/100986249

在这里插入图片描述

mohoooooo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【6】目标检测之YOLO v3

这里写目录标题改进Darknet-53多尺度特征图预测正负样本匹配网络结构知识点损失函数改进Darknet-53骨干网络采用Darknet-53 的网络结构，含有53个卷积层，增加了残差结构。多尺度特征图预测YOLO v3 更进一步采用了 3 个不同尺度的特征图来进行对象检测，可以参考下面的网络结构图，通过聚类的方法生成了9种先验框(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。在最小的
复制链接

扫一扫

专栏目录