【YOLO系列】YOLO.v1算法原理详解

天真的和感伤的想象家

已于 2022-08-15 15:16:48 修改

阅读量2.5k

点赞数 2

分类专栏：目标检测文章标签：算法深度学习计算机视觉

于 2022-08-08 17:39:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/deepsprings/article/details/126232331

版权

YOLO(You Only Look Once)系列算法原理

前言：详细介绍了yolo系列目标检测算法的原理和发展过程。

系列：
【YOLO系列】YOLO.v1算法原理详解
 【YOLO系列】YOLO.v2算法原理详解
 【YOLO系列】YOLO.v3算法原理详解
 【YOLO系列】YOLO.v4 & YOLO.v5算法原理详解

文章目录

YOLO(You Only Look Once)系列算法原理
- 1. YOLO.v1

1. YOLO.v1

1.1 基本概述

论文参考：You only look once unified real-time object detection

yolov1 是使用 one-stage 方法进行目标检测。核心思想是把目标检测问题处理成回归问题。

输入图像通过一个卷积神经网络，直接输出最终预测框位置和类别（概率）。

1.2 算法流程

整个YOLO检测系统如下图所示。

在这里插入图片描述

假设网络实现的预测类别数为 C 个

论文中使用 PASCAL VOC数据集，C=20，即实现20类别物品的目标检测；
输入图像首先被 resize 到指定尺寸

论文中将输入图像统一调整到 448 $\times$ 448 ；

即网络输入： $448\times 448 \times 3$ ；
对图像进行划分，共划分 $S\times S$ 个方格（即grid），

论文中 S=7, 即共划分 $7\times 7=49$ 个方格；

每个方格包含 $64\times 64$ 个像素点；
针对每个方格grid，
- 生成 C 个类别目标的概率分数（表示该方格是否存在该目标的概率）,用 p 表示。
- 生成 B 个检测框（即bbox, 用于检测目标），每个检测框共 5 个参数 $(x, y, w, h, c)$ 。
  
  使用

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。