Yolov3详细解析

最新推荐文章于 2023-11-07 23:15:07 发布

做个精致男孩呀

最新推荐文章于 2023-11-07 23:15:07 发布

阅读量1.1k

点赞数

文章标签：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yexufan1755/article/details/102946814

版权

YOLO算法详解

YOLO算法出自于 You Only Look Once: Unified, Real-Time Object Detection。

目标检测与分析

图像识别算法是计算机视觉的基础算法，例如VGG，GoogLeNet，ResNet等，这类算法主要是判断图片中目标的种类。
目标检测和图像识别类似。但是目标检测不仅要识别图像中物体的类别，还要获得图像中物体的位置、大小、类别等，并返回其坐标值。

例如上图。在图像识别中，对于人，车，自行车这三类来说，图像识别会给出个预测的概率矩阵[0.1,0.9,0.1]，因此该图像会被识别成车这一类别。而目标检测中，不仅要预测这是辆车，还要给出车的中心坐标，车的长和宽。对于目标检测来说，输出结果类似于这种格式：

目标检测的输出结果
其中:

pc 为1时代表有物体被检测到，反之，没有物体被检测到，因此其他的输出值可以被忽略
bx 目标的x坐标值为目标的左上角到物体中心的相对坐标
by 目标的y坐标值为目标的右下角到物体中心的相对坐标值
bh 区域框bounding box的高
bw 区域框bounding box的宽

c1、c2、c3是目标属于人、车、自行车的概率，基于此，我们可以使用滑动窗口对整张图片进行处理来定位目标。就像是用一个放大镜去图像的每个区域去查找是否包含目标。这样的方法简单粗暴有效，但是效率极低，计算复杂度太高，所以不会这么去做。

YOLO_V1

目前，基于深度学习算法的一系列目标检测算法大致可以分为两大流派：

两步走（two-stage）算法：先产生候选区域然后再进行CNN分类(RCNN系列)，
一步走（one-stage）算法：直接对输入图像应用算法并输出类别和相应的定位(YOLO系列)

之前的R-CNN系列虽然准确率比较高，但是即使是发展到Faster R-CNN，检测一张图片如上图所示也要7fps(原文为5fps)，为了使得检测的工作能够用到实时的场景中，提出了YOLO。

YOLO是You Only Look Once的缩写。这也是为了特别突出YOLO区别于两阶段算法的特点，从名字就可以感受到，YOLO算法速度很快，事实上也是如此。可以看出在同样的设备上，YOLO可以达到45帧每秒的速度。

下面是YOLO的模型框架图：
在这里插入图片描述

做个精致男孩呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。