YOLO 目标检测网络学习笔记

shuyeah

已于 2023-12-31 00:03:36 修改

阅读量2.2k

点赞数 2

文章标签：计算机视觉

于 2020-08-31 11:35:53 首次发布

本文链接：https://blog.csdn.net/weixin_43227526/article/details/108313253

版权

本文深入探讨YOLO（You Only Look Once）系列目标检测算法，从YOLO v1的核心思想、结构流程及损失函数，到YOLO v2的改进，如BN层、多尺度训练，再到YOLO v3的DarkNet53 backbone和多尺度预测。通过对比YOLO与Faster R-CNN，揭示YOLO的优势与不足，适合对目标检测感兴趣的读者。

摘要由CSDN通过智能技术生成

YOLO v1

1、核心思想

YOLO算法的核心思想是，将整张图片作为输入，利用网络的输出结果直接回归预测出bounding box的调整参数和物体所属类别。

2、结构流程

YOLOv1的整体结构流程是，对于一张输入的图片进行特征提取，输出的特征层可以看做把原始图片划分成s×s的网格，如果我替的中心点络在某一网格内则这个物体就由该网格负责预测。
每一个网格有B个bounding box.除了需要预测Bounding box位置信息，还需要预测一个值confidence，confidence这个值在faster CNN网络中是没有的。confidence的计算方法：
在这里插入图片描述
如果bounding box中存在物体，则第一个值等于1，否则等于0。第二个指标是预测框和真实框的重和程度。

论文中yolo模型的结构如图所示，输出特征层大小为7×7×30.
通道数30表示的含义是：对于VOC数据集物体类别总数为20，每一个网格对应2个bounding box,每一个bounding box对应框中是否存在物体和bounding box的调整参数(h,w,x,y)。
在test 过程中，计算
在这里插入图片描述
包含三个信息：预测框中是否存在物体，预测框的调整参数，还有物体所属类别。
class信息是针对每个网格的，confidence信息是针对每个bounding box的。

3、Loss计算方法

yolo v1损失函数包括三部分：
bounding box位置和宽高信息,confidence,class

这三部分内容和上面式子中的内容是对应的：confidence计算预测框中是否存在物体的 loss（存在物体判断为不存在物体，不存在物体判断为存在物体），bounding box 计算框的位置和大小信息的 loss，class计算网格中物体所属类别的 l

最低0.47元/天解锁文章

shuyeah

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
YOLO 目标检测网络学习笔记

YOLO v11、核心思想YOLO算法的核心思想是，将整张图片作为输入，利用网络的输出结果直接回归预测出bounding box的调整参数和物体所属类别。2、结构流程YOLOv1的整体结构流程是，对于一张输入的图片进行特征提取，输出的特征层可以看做把原始图片划分成s×s的网格，如果我替的中心点络在某一网格内则这个物体就由该网格负责预测。每一个网格有B个bounding box.除了需要预测Bounding box位置信息，还需要预测一个值confidence，这个值在faster CNN网络中是没
复制链接

扫一扫