论文阅读笔记：(YOLO 看一次就够了) You Only Look Once: Unified, Real-Time Object Detection

最新推荐文章于 2025-04-29 11:02:36 发布

置顶

tangwei2014

最新推荐文章于 2025-04-29 11:02:36 发布

阅读量3.7w

点赞数 51

分类专栏：论文阅读笔记深度学习论文笔记文章标签： YOLO 目标检测 RCNN 阅读笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tangwei2014/article/details/50915317

版权

尊重原创，转载请注明：http://blog.csdn.net/tangwei2014

这是继RCNN，fast-RCNN 和 faster-RCNN之后，rbg（Ross Girshick）大神挂名的又一大作，起了一个很娱乐化的名字：YOLO。
虽然目前版本还有一些硬伤，但是解决了目前基于DL检测中一个大痛点，就是速度问题。
其增强版本GPU中能跑45fps，简化版本155fps。

论文下载：http://arxiv.org/abs/1506.02640
代码下载：https://github.com/pjreddie/darknet

本篇博文focus到方法上。实验结果等整理全了再奉上。

YOLO的核心思想

YOLO的核心思想就是利用整张图作为网络的输入，直接在输出层回归bounding box的位置和bounding box所属的类别。
没记错的话faster RCNN中也直接用整张图作为输入，但是faster-RCNN整体还是采用了RCNN那种 proposal+classifier的思想，只不过是将提取proposal的步骤放在CNN中实现了。

2.YOLO的实现方法

将一幅图像分成SxS个网格(grid cell)，如果某个object的中心落在这个网格中，则这个网格就负责预测这个object。

最低0.47元/天解锁文章

评论 22

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。