yolov3实现之理论

最新推荐文章于 2024-06-07 01:53:59 发布

置顶奔跑熊

最新推荐文章于 2024-06-07 01:53:59 发布

阅读量3.3k

点赞数 7

分类专栏： pytorch DeepLearning pytorch 文章标签： yolov3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yongjiankuang/article/details/94336546

版权

DeepLearning 同时被 3 个专栏收录

18 篇文章 2 订阅

订阅专栏

6 篇文章 1 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

1、yolov3简介

yolov3已经出来好久了，最近花了些时间分析了下yolov3的源码。yolov3并没有很大的创新，更多的是借鉴了最近两年一些网络构造技巧。不过不得不承认效果还是很赞的，在保持速度的前提下，提升了预测精度，尤其是小目标物体的检测相比v1、v2来说得到了较大的改善。

yolov3的主要改进：调整了网络结构；利用多尺度特征进行目标检测；对象分类用logistic取代了softmax。

2、网络结构

以darknet-53为例，具体结构如下：

其中Residual示意图如下：

3、利用多尺度进行目标检测

yolo2中也采用了passthrough结构来检测细粒度特征，在yolo3中则采用了3个不同尺度的特征图进行目标检测。三个尺度的特征图尺度相对输入图片的stride分别为32、16、8；stride越大则特征图的局部野越大，能够用于检测较大的目标物体，stride越小则反之。同时，anchors的引入能够使得网络更好的进行学习。网络中采用了9中尺度的先验框，具体分配如下：

具体如下(黄色框为gt，蓝色框为anchors)：

4、输入到输出的映射

输出的数据分布维度信息如下：

对于416*416的输入图像，没个尺度特征图的每个网络设置3个先验框，总共有13*13*3 + 26 * 26 *3 + 52 * 52 * 3 = 10647个预测结果，没个榆次是(4 + 1 + 80) = 85维向量。而yolo2中只有845个预测。

5、总结

yolo3借鉴了残差网络，形成了更深的网络层次，以及多尺度检测，提升了map以及小物体检测效果。

个人水平有限，很多东西也是参考了其他人的成果，在此表示感谢，如果文中有误之处请指教，谢谢！

关注

7
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
yolov3实现之理论

1、yolov3简介 yolov3已经出来好久了，最近花了些时间分析了下yolov3的源码。yolov3并没有很大的创新，更多的是借鉴了最近两年一些网络构造技巧。不过不得不承认效果还是很赞的，在保持速度的前提下，提升了预测精度，尤其是小目标物体的检测相比v1、v2来说得到了较大的改善。 yolov3的主要改进：调整了网络结构；利用多尺度特征进行目标...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。