YOLO v1

最新推荐文章于 2024-06-26 15:04:49 发布

济南小方老师

最新推荐文章于 2024-06-26 15:04:49 发布

阅读量1.1k

点赞数 1

文章标签： yolo 目标检测深度学习

本文链接：https://blog.csdn.net/Vin1282023650/article/details/79342424

版权

YOLO（You Only Look Once）是一种实时目标检测系统，以端到端的方式进行训练和检测，如YOLO v1能在每秒45帧的速度下运行。通过将图像划分为网格并预测每个网格的边界框和类别概率，YOLO实现了快速检测。然而，它在处理紧密相邻物体和小目标时表现不佳，主要由于损失函数的设计导致的定位误差。

摘要由CSDN通过智能技术生成

1. YOLO简述

YOLO 来源于Facebook，整个训练和检测过程都是end-to-end的，能够达到实时的目标检测，YOLO v1能够达到每秒45帧的速度，Fast YOLO能够达到每秒155帧的速度，但是YOLO v1存在目标定位不准的问题。

2. 操作步骤

整个检测过程共分为三个步骤进行：首先，将图像缩放至448×448；然后，通过单个卷积神经网络直接从图像中进行目标检测（bounding box）和分类（classification）；最后，通过NMS抑制输出最终结果。

具体的实现步骤：首先将Image划分为S×S（S = 7）的格子（grid cell），如果某个目标的中心落入某个格子中，则该格子就负责检测该目标（如下图）。每个grid cell预测B个bounding boxes和C个分类，最终的输出为S×S×( B×5 + C )。每个bounding box是个5维的数据，分别是（x，y，w，h，confidence），其中x表示bounding box的中心横坐标，y表示bounding box的中心纵坐标，w表示bounding box的宽度，h表示bounding box的长度，confidence表示目标的置信值。置信值 = 该格子包含目标的类别概率P × IOU（bounding box的置信度 = truth / pred）。每个格子预测包含某一类目标的概率值，此时类别数C = 20，那么每个格子都要对20个类别的概率进行预测。置信值衡量了某类别i出现在某box中的概率，以及该box与目标i的吻合程度。

最低0.47元/天解锁文章

济南小方老师

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
YOLO v1

1. YOLO简述 YOLO 来源于Facebook，整个训练和检测过程都是end-to-end的，能够达到实时的目标检测，YOLO v1能够达到每秒45帧的速度，Fast YOLO能够达到每秒155帧的速度，但是YOLO v1存在目标定位不准的问题。2. 操作步骤整个检测过程共分为三个步骤进行：首先，将图像缩放至448×448；然后，通过单个卷积神经网络直接从图像中进行目标检测...
复制链接

扫一扫