目标检测模型 YOLOv3 (YOLOv3: An Incremental Improvement)

YOLOv3

YOLOv3: An incremental Improvement

一、简述

YOLOv3没有在YOLO9000上做出巨大的改进,它的工作更多的是基于YOLOv2的思路,设计了一个新的网络结构(Darknet-53),并将当时的一些新的点子加到这个模型上,以此来提高YOLO系列目标检测模型的准确率。

YOLOv3的改进主要有:建立新的CNN模型(引入残差块);利用多尺度特征进行目标检测;在分类时使用Logistic代替softmax。

这篇文章比较随心所欲,最后作者阐述了自己一些关于计算机视觉的隐患(获取私人信息,军工等),并希望其他人在从事该领域时有更多的责任感。

二、YOLOv3模型

Darknet-53:

在Darknet-19的基础上,作者引入了Resnet中的shortcut connection。

回顾:上图是Resnet的组成元素,残差块。残差网络的思想是当某层网络已经很好地学习到了特征,那么之后的层出现一点小的变化就会使性能变差,而让某层网络自学习来与之前某层相同是非常困难的。因此残差块将前面某层的输入直接加到后层,使网络很容易与前面某层相同,那么至少性能不会变差。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nWs2s8O8-1601568418672)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps2.jpg)]

为了提高检测的粒度,作者引入了多尺度检测,同时对网络进行了扩充,最终的网络达到了53个卷积层。

在这里插入图片描述

  1. 基于多尺度的预测 Predictions Across Scales:用于提高检测粒度

为什么这样做会有更细的粒度:

1)将前面某层的特征图与当前层的特征图堆叠,由此就包含了前面更小的特征,这个方法与YOLOv2一致。

2)上采样:从感受野的角度考虑

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-efx9YRpj-1601568418673)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps4.jpg)]

YOLOv3在3个不同的尺度上预测bbox。首先先按照v2的思路构建好网络,然后取出此输出层向前数第二层的特征图进行2倍上采样,然后从前面的某层取出特征图,将它们堆叠,按照这样的方法我们就可以得到粒度更细的语义信息了。然后作者又按照同样的方法又构建了一个尺度的模块,所以检测会基于三个尺度。因为有三种尺度,所以作者分别为它们设置了3个不同大小的anchor box。

每次上采样,感受野都在减小,直观的展现是:

蓝色是anchor box,黄色是ground truth,红色是中心所在的栅格

  1. softmax变为logistic

在这个模型中不能使用softmax,因为softmax对一个目标只能输出一个标签,而logistic支持多标签对象(如:Woman,Person)

  1. 输出

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9WwC44fN-1601568418674)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps8.jpg)]

一共有 13 × 13 × 3 + 26 × 26 × 3 + 52 × 52 × 3 = 10647 13\times 13\times 3+26\times 26\times 3+52\times 52\times3=10647 13×13×3+26×26×3+52×52×3=10647个预测

三、结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g279D46M-1601568418676)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps9.jpg)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xhN6QSYu-1601568418677)(file:///C:\Users\lenovo\AppData\Local\Temp\ksohtml20544\wps10.jpg)]

YOLOv3在速度和准确率上较为平衡,总之它是效果很好的检测模型。

四、参考

YOLOv3: An Incremental Improvement

简书:YOLOv3 深入理解

https://www.jianshu.com/p/d13ae1055302

CSDN:YOLOv3网络结构和解析

https://blog.csdn.net/dz4543/article/details/90049377

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值