目标检测——细读YOLO V1

qian99

于 2018-09-08 14:11:13 发布

阅读量880

点赞数 2

分类专栏：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qian99/article/details/82529075

版权

Yolo（You Only Look Once）是一个end-to-end的目标检测算法。作者在论文中提出，人类的视觉系统是快速和准确的，人们瞥一眼图像，立即知道图像中的物体是什么，它们在哪里以及它们如何相互作用。而对于Rcnn系列的方法，都是需要先找到有可能有物体的框(anchor box)，然后进行前背景分类，nms消除重叠框，重新进行坐标回归和分类，这个流程就比较复杂，并且每个步骤的组件的优化都比较麻烦，无论是训练还是最终的测试，速度都非常慢。

因此，yolo的作者提出，将目标检测的问题转化为一个回归问题，只通过一个步骤就能找到目标的位置。

Yolo的检测步骤：

将图像划分成 $S \times S$ 的网格，如果一个目标物体的中心点落在一个网格中，那么这个网格就负责预测这个目标。
每个网格预测B个边框和置信度分数。
边框用 $x , y , w, h$ 表示， $(x, y)$ 表示目标边框的中心相对于网格的位置（论文里没说是相对于网格的中心还是左上角之类的，实际情况两种应该没什么差别），而 $w, h$ 是相对于整个图像的大小。
置信度表示预测框与实际框之间的IOU。
每个网格还预测 $C$ 个类的概率 $Pr(Class_i|Object)$ ，也就是在这个网格有物体的情况下，是某个类的概率。值得一提的是，一个网格只预测一组类的概率，和预测的框的数量 $B$ 没有关系。
最终，网络的输出就为 $S \times S \times (B * 5 + C)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。