目标检测模型 YOLOv3 (YOLOv3: An Incremental Improvement)

最新推荐文章于 2024-05-17 02:40:55 发布

王心远

最新推荐文章于 2024-05-17 02:40:55 发布

阅读量423

点赞数 1

分类专栏：深度学习与目标检测文章标签：深度学习机器学习神经网络

本文链接：https://blog.csdn.net/weixin_43931548/article/details/108898649

版权

深度学习与目标检测专栏收录该内容

6 篇文章 1 订阅

订阅专栏

YOLOv3

YOLOv3: An incremental Improvement

一、简述

YOLOv3没有在YOLO9000上做出巨大的改进，它的工作更多的是基于YOLOv2的思路，设计了一个新的网络结构（Darknet-53），并将当时的一些新的点子加到这个模型上，以此来提高YOLO系列目标检测模型的准确率。

YOLOv3的改进主要有：建立新的CNN模型（引入残差块）；利用多尺度特征进行目标检测；在分类时使用Logistic代替softmax。

这篇文章比较随心所欲，最后作者阐述了自己一些关于计算机视觉的隐患（获取私人信息，军工等），并希望其他人在从事该领域时有更多的责任感。

二、YOLOv3模型

Darknet-53：

在Darknet-19的基础上，作者引入了Resnet中的shortcut connection。

回顾：上图是Resnet的组成元素，残差块。残差网络的思想是当某层网络已经很好地学习到了特征，那么之后的层出现一点小的变化就会使性能变差，而让某层网络自学习来与之前某层相同是非常困难的。因此残差块将前面某层的输入直接加到后层，使网络很容易与前面某层相同，那么至少性能不会变差。

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nWs2s8O8-1601568418672)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps2.jpg)]$

为了提高检测的粒度，作者引入了多尺度检测，同时对网络进行了扩充，最终的网络达到了53个卷积层。

在这里插入图片描述

基于多尺度的预测 Predictions Across Scales：用于提高检测粒度

为什么这样做会有更细的粒度：

1）将前面某层的特征图与当前层的特征图堆叠，由此就包含了前面更小的特征，这个方法与YOLOv2一致。

2）上采样：从感受野的角度考虑

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-efx9YRpj-1601568418673)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps4.jpg)]

YOLOv3在3个不同的尺度上预测bbox。首先先按照v2的思路构建好网络，然后取出此输出层向前数第二层的特征图进行2倍上采样，然后从前面的某层取出特征图，将它们堆叠，按照这样的方法我们就可以得到粒度更细的语义信息了。然后作者又按照同样的方法又构建了一个尺度的模块，所以检测会基于三个尺度。因为有三种尺度，所以作者分别为它们设置了3个不同大小的anchor box。

每次上采样，感受野都在减小，直观的展现是：

蓝色是anchor box，黄色是ground truth，红色是中心所在的栅格

softmax变为logistic

在这个模型中不能使用softmax，因为softmax对一个目标只能输出一个标签，而logistic支持多标签对象（如：Woman，Person）

输出

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9WwC44fN-1601568418674)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps8.jpg)]$

一共有 $13\times 13\times 3+26\times 26\times 3+52\times 52\times3=10647$ 个预测

三、结果

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g279D46M-1601568418676)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps9.jpg)]$

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xhN6QSYu-1601568418677)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps10.jpg)]$

YOLOv3在速度和准确率上较为平衡，总之它是效果很好的检测模型。

四、参考

YOLOv3: An Incremental Improvement

简书：YOLOv3 深入理解

https://www.jianshu.com/p/d13ae1055302

CSDN：YOLOv3网络结构和解析

https://blog.csdn.net/dz4543/article/details/90049377

王心远

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
目标检测模型 YOLOv3 (YOLOv3: An Incremental Improvement)

YOLOv3YOLOv3: An incremental Improvement一、简述YOLOv3没有在YOLO9000上做出巨大的改进，它的工作更多的是基于YOLOv2的思路，设计了一个新的网络结构（Darknet-53），并将当时的一些新的点子加到这个模型上，以此来提高YOLO系列目标检测模型的准确率。YOLOv3的改进主要有：建立新的CNN模型（引入残差块）；利用多尺度特征进行目标检测；在分类时使用Logistic代替softmax。这篇文章比较随心所欲，最后作者阐述了自己一些关于计算机视
复制链接

扫一扫