《You Only Look Once: Unified, Real-Time Object Detection》翻译

最新推荐文章于 2023-03-06 13:40:05 发布

大彤小忆

最新推荐文章于 2023-03-06 13:40:05 发布

阅读量2.5k

点赞数 1

分类专栏：论文阅读文章标签： YOLO 卷积神经网络目标检测

原文链接：https://xueshu.baidu.com/usercenter/paper/show?paperid=990e43203563fc8f9e4fb9ea1df68b1f&site=xueshu_se

版权

论文阅读专栏收录该内容

11 篇文章 2 订阅

订阅专栏

$You\ _{}Only\ _{}Look\ _{}Once: Unified, Real-Time\ _{}Object\ _{}Detection$

$Joseph\ _{}Redmon，Santosh\ _{}Divvala，Ross\ _{}Girshick，Ali Farhadi$

$你只需要看一次：统一的实时目标检测$

摘要：我们介绍YOLO，这是一种新的目标检测方法。之前的目标检测工作是通过重新使用分类器来进行检测。取而代之，我们将目标检测设计为空间分隔的边界框和相关类别概率的回归问题。单个神经网络可以在一次评估中直接从完整图像中预测边界框和类别概率。由于整个检测通道是单个网络，因此可以直接在检测性能上进行端到端优化。
我们的统一架构非常快，基础YOLO模型以每秒45帧的速度实时处理图像。较小的网络Fast YOLO惊人的每秒处理155帧，而且实现了其他实时检测器两倍的mAP。与最先进的检测系统相比，YOLO会产生更多的定位错误，但在背景上预测假阳性的可能性较小。最后，YOLO学习了非常普通的目标表示形式。从自然图像推广到艺术品等其他领域时，它的性能优于其他检测方法，包括DPM和R-CNN。

在这里插入图片描述

图1 YOLO检测系统。使用YOLO处理图像非常简单明了。我们的系统(1)将输入图像的大小调整为448×448，(2)在图像上运行单个卷积网络，并且(3)通过模型的置信度对检测结果进行阈值化。

在这里插入图片描述

图2 模型。我们的系统模型检测作为一个回归问题。它将图像划分为S×S网格，并为每个网格单元预测B边界框，这些框的置信度和C类别概率。这些预测被编码为S×S×(B∗5+C)张量。

在这里插入图片描述

图3 架构。我们的检测网络有24个卷积层，然后是2个全连接层。交替的1×1卷积层减少了前面层的特征空间。我们以一半的分辨率（224×224输入图像）对ImageNet分类任务上的卷积层进行预训练，然后将分辨率提高一倍以进行检测。

在这里插入图片描述

图6 定性结果。 YOLO运行来自网络上的艺术品和自然图像。尽管它确实认为一个人是一架飞机，但大多数情况下都是准确的。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
《You Only Look Once: Unified, Real-Time Object Detection》翻译

You Only Look Once:Unified,Real−Time Object DetectionYou\ _{}Only\ _{}Look\ _{}Once: Unified, Real-Time\ _{}Object\ _{}DetectionYou Only Look Once:Unified,Real−Time Object DetectionJoseph ..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。