【YOLO V1】目标检测模型之YOLO V1框架

最新推荐文章于 2023-11-16 15:45:53 发布

Easy.miclover

最新推荐文章于 2023-11-16 15:45:53 发布

阅读量842

点赞数 1

分类专栏： # 深度学习框架

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/miclover_feng/article/details/105901972

版权

深度学习框架专栏收录该内容

9 篇文章 0 订阅

订阅专栏


论文名称	YOLO-v1:You Only Look Once: Unified, Real-Time Object Detection
作者	miclover
参考	https://blog.csdn.net/hrsstudy/article/details/70305791 https://zhuanlan.zhihu.com/p/50523211 https://www.bilibili.com/video/BV1mp411o7jJ?p=3
书摘
核心思想：利用整张图作为网络的输入，直接在输出层回归 bounding box（边界框）的位置及其所属的类别特点：运行速度很快，可以用于实时系统网络结构：卷基层全连接层 YOLO V1 24 2 FastYOLO 9 2 论文中，将输出图片被划分为 77=49 个网格（ grid cell ），每个网格允许预测出2个边框（bounding box，包含某个对象的矩形框），总共 492=98 个bounding box。如果某个 object 的中心落在这个网格中，则这个网格就负责预测这个object。每个网格要预测 2 个 bounding box，每个 bounding box 除了要回归自身的位置之外，还要附带预测一个 confidence 值。这个 confidence 代表了所预测的 box 中含有 object 的置信度和这个 box 预测的有多准这两重信息，其值是这样计算的： Pr表示是否为目标，是为1，否为0；并且在为1的情况下IoU值。 Loss损失函数： output结果向量为：7730的结构，其中某一网格为如下所示：前两个为坐标预测；中间为置信度的预测；最后为类别的预测。第 i 个单元格存在目标，且该单元格中的第 j 个边界框负责预测该目标指的是第 i 个单元格存在目标增加了边界框坐标预测的损失，并减少了不包含对象的框的置信预测的损失。预测阶段： conditional class probability（类条件概率）信息是针对每个网格的。 confidence信息是针对每个bounding box的。测试阶段，首先对网络输出的7730中的各自conditional class probabilities与每个 bounding box的 confidence相乘。通过上述处理，我们可以获取到每一个bounding box的具体confidence分数，这就使得结果中的每一个bounding box 既包含了预测的class的 probability信息，也反映了bounding box是否含有Object和bounding box坐标的准确度。通过上述操作之后，我们将得到772 = 98个维度为20的数据。得到每个bounding box 的具体confidence分数以后，设置阈值，滤掉得分低的boxes，在惊醒降序排列，对保留的boxes进行NMS（非极大值预测）处理，就得到最终的检测结果。非极大值预测（NMS）： NMS算法主要解决的是一个目标被多次检测的问题以dog类别为例，上述9820的数据降序排列之后，得到如下的结果。我们将使用概率最大的bounding box这个，与其他非零概率的一一比较（参与比较的我们称之为 bboc_cur* ）。如果，IoU值>0.5->将其设置为0；然后继续往下比较比较完成之后，我们将会再次将接下来的次大的非零概率为bbox_max，依次比较。所有的比较完之后，基本都是零了，现在的话选取目标框。
注解
目前，基于深度学习算法的一系列目标检测算法大致可以分为两大流派： 1.两步走（two-stage）算法：先产生候选区域然后再进行CNN分类(RCNN系列)， 2.一步走（one-stage）算法：直接对输入图像应用算法并输出类别和相应的定位(YOLO系列)
缺点
1、采用了多个下采样层，网络学到的物体特征并不精细，因此也会影响检测效果。 2、同一类物体出现的新的不常见的长宽比和其他情况时，泛化能力偏弱。 3、由于损失函数的问题，定位误差是影响检测效果的主要原因。尤其是大小物体的处理上，还有待加强。 4、YOLO 对相互靠的很近的物体，还有很小的群体检测效果不好，这是因为一个网格中只预测了两个框，并且只属于一类。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。