目标检测-One Stage-YOLO v3

学海一叶

已于 2024-01-05 10:15:23 修改

阅读量1.2k

点赞数 23

分类专栏：目标检测文章标签：目标检测 YOLO 人工智能计算机视觉算法

于 2024-01-04 09:58:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/long11350/article/details/135357677

版权

目标检测专栏收录该内容

20 篇文章 1 订阅

订阅专栏

YOLOv3通过优化网络结构（DarkNet53+FPN），引入多尺度特征图和逻辑回归分类器，显著提升了目标检测的速度和精度。相比YOLOv2，YOLOv3在保持高精度的同时，速度提高了三倍以上，如YOLOv3-320达到28.2mAP且速度为22ms，优于SSD321和RetinaNet-101-800。

摘要由CSDN通过智能技术生成

文章目录

前言
一、YOLO v3的网络结构和流程
二、YOLO v3的创新点
总结

前言

根据前文目标检测-One Stage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升，但是精度仍较低，YOLO v3基于一些先进的结构和思想对YOLO v2做了一些改进。

提示：以下是本篇文章正文内容，下面内容和可供参考

一、YOLO v3的网络结构和流程

将影像输入卷积网络（DarkNet53）+FPN得到多尺度特征图

ps：Darknet53，由Darknet19结合Resnet而成

利用anchor机制获取预选框
将上一步得到的anchor输入不同的分类和边框回归器
使用非极大值抑制NMS去除冗余窗口

在这里插入图片描述

二、YOLO v3的创新点

具体来说，没有什么大的创新点，但是结合先进的思想改进了YOLOv2：

将backbone的网络结构进行了改进，将Darknet19结合Resnet（残差块轻量化），变成了Darknet53（Darknet53的性能与ResNet152相似，速度快2倍）
引入多尺度特征图（feature maps），每个尺寸的feature map各司其职，13 × 13负责大目标物体，26 × 26负责中目标物体和52 × 52负责小目标物体。原因很简单，越深层的信息越抽象，越浅层的越粗糙，浅层还保留着小物体的信息，深层就不一定还在了。

ps：和SSD一样，感受野小的feature map检测小目标（较小的scale），使用感受野大的feature map检测更大目标（较大的scale），但加入了特征融合机制。

类别预测方面使用多个逻辑回归分类器（logistic）代替softmax分类器，以此来确定预测框属于多类的可能

softmax（全部类别的概率之和为1）假定全部类别是互斥的，即如果预测框属于类别A，那么就不可能属于类别B
但面对非互斥类别集时，softmax不能判别多类别归属，比如预测框可能既属于“动物”，又属于“狗”，尤其对于Open Images这种数据集，目标可能有重叠的类别标签
因此yolov3使用不同的logistic回归分类器（数量和类别数对应）检验bbox为每个类别的置信度（objectness score），如果超过一定阈值，就可认为bbox属于某个类别，即可实现多类别分类

总结

YOLOv3-320(28.2mAP)与SSD321一样准确（28.0mAP[.5, .95]），但速度快三倍（61ms -> 22ms）

在mAP50上（57.9），YOLOv3-608和当时的SOTA（RetinaNet-101-800）精度一样（57.5），但要快3.8倍（198ms -> 51ms）

在这里插入图片描述

关注

23
点赞
踩
24

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

学海一叶 CSDN认证博客专家 CSDN认证企业博客

码龄5年

79: 原创

4万+: 周排名

9万+: 总排名

11万+: 访问

: 等级

1740: 积分

771: 粉丝

895: 获赞

28: 评论

1249: 收藏

私信

关注

热门文章

分类专栏

图像分割 2篇
LLM 14篇
强化学习 2篇
目标检测 20篇
机器学习 3篇
C++ 6篇
Kaggle 2篇
图神经网络 2篇
时序预测 3篇
计算机视觉 1篇
Vue3 1篇
Python 2篇
Django 3篇
Linux 8篇
WebGIS 1篇
QGIS 6篇
GEE学习 1篇
C++ GDAL学习之旅 2篇
Git学习 2篇

最新评论

大语言模型系列-GPT-3.5(ChatGPT)
征途黯然.: The explanation of 大语言模型系列GPT35ChatGPT in this article is vivid, offering a deeper understanding.
大语言模型系列-GPT-3.5(ChatGPT)
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618183501。
机器学习系列-机器学习范式
白话机器学习: 内容丰富图文并茂，认真看完收获很大。思路清晰细节满满，支持大佬优质好文。
目标检测-One Stage-YOLOv8
m0_68949064: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文。
目标检测-One Stage-YOLOv4
征途黯然.: 目标检测OneStageYOLOv4文章非常令人印象深刻，我从中学到了很多新知识。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

学海一叶 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。