论文笔记：You Only Look Once: Unified, Real-Time Object Detection

最新推荐文章于 2022-12-02 20:15:49 发布

樱与刀

最新推荐文章于 2022-12-02 20:15:49 发布

阅读量1k

点赞数 3

分类专栏：目标检测与识别文章标签： cv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alip39/article/details/82389738

版权

论文笔记：You Only Look Once: Unified, Real-Time Object Detection

简述

这是YOLO算法的第一个版本。
作者先简单介绍了之前对目标识别的相关算法，比如利用滑动窗口的算法，还有R-CNN算法。但是作者说，这两种方法都太慢，并且难以优化。
作者认为YOLO算法十分简单，将目标检测问题处理成回归问题，用一个卷积神经网络结构就可以从输入图像直接预测bounding box和类别概率。因此YOLO算法具有以下优点：1. 十分迅速 2.当进行预测时，考虑全局图像，不想窗口滑动算法和R-CNN算法 3. 学习的物体的一般特性。但是对于小目标的识别，此算法还是较为吃力。

算法流程与思想

以下是算法的流程图：

这里写图片描述

首先，将输入图片resize到448*448的大小，然后，使用模型来处理图片，最后通过置信度（confidence）来筛选检测结果。

作者指出，这种网络使用从整张图片（entire image）来获取的特征（features）来预测边界框（bounding box）。这就意味着我们的算法是考虑到图片的全局的，并确保了端到端的训练与较高的即时检测的准确度。

算法的步骤：

这里写图片描述

算法首先把输入图像划分成S*S的格子（在上图狗的图像中，分成了7*7的格子），每个格子（grid cell）都预测B个bounding boxes，每个bounding box都包含5个预测值：x,y,w,h和confidence。

其中：
（x

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
论文笔记：You Only Look Once: Unified, Real-Time Object Detection

论文笔记：You Only Look Once: Unified, Real-Time Object Detection简述这是YOLO算法的第一个版本。作者先简单介绍了之前对目标识别的相关算法，比如利用滑动窗口的算法，还有R-CNN算法。但是作者说，这两种方法都太慢，并且难以优化。作者认为YOLO算法十分简单，将目标检测问题处理成回归问题，用一个卷积神经网络结构就可以从输入...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。