YOLO

最新推荐文章于 2023-04-13 17:13:32 发布

baihaisheng

最新推荐文章于 2023-04-13 17:13:32 发布

阅读量268

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_41128383/article/details/105278287

版权

深度学习专栏收录该内容

22 篇文章 4 订阅

订阅专栏

概述

目标检测就是要找出图片中物体的bounding box（边界框），并判定框内物体的类别。假如图片中有一只猫，那我们要将这只猫用一个bounding box框出来(bounding box用左上角坐标(x,y)和矩形的宽高(w，h)来表示)

yolo算法的思想

将输入的图像划分成SXS大小的网格，如果物体的中心落到那个网路，那个网络就负责预测这个物体，如下图所示红色框表示物体的中心。
在这里插入图片描述

网络架构

在这里插入图片描述

最后网络输出的7 x 7 x 30的特征图，可以理解成7X7个单元格
每个单元格有两个predictor，每个predictor分别预测一个bounding box的x，y，w，h和相应的confidence（置信度），还有一个单元格的类别概率

如何预测的

Confidence预测
confidence表示：单元格预测的bounding box包含一个物体的置信度，置信度有多高就该bounding box预测准确度有多大，用公式表示为如下如所示
公式解释：
如果grid cell里面没有object，所有bbox设置的confidence就是0
如果含有目标，confidence就是1，则confidence score等于预测的box和ground truth的IOU乘积
Bounding box预测
bounding box的预测包括xywh四个值。xy表示bounding box的中心相对于cell左上角坐标偏移，宽高则是相对于整张图片的宽高。
类别预测
物体类别是预测是基于条件概率 P (Class∣Object)进行预测的，

条件类概率和每个bounding box的预测的置信度值相乘得到每个bounding box特定类别的置信度分数（Class-Specific Confidence Score）。这些分数体现了该类出现在框中的概率以及预测框拟合目标的程度
nms
每个Bbox的Class-Specific Confidence Score以后，设置阈值，滤掉概率的低的bbox，最终满足要求的bounding box，通过NMS筛选出和真正的bbox拟合度高的BBOX作为预测结果
训练损失计算
损失包括三部分损失：bbox损失+confidence损失+classfication损失
有物体中心落在单元个中，需要计算classfication损失，两个predictor都要计算confidence loss，预测的bounding box与ground truth IOU比较大的那个predictor需要计算xywh loss。
没有物体中心落入的单元格，只需要计算confidence loss
缺点：
YOLO对相互靠的很近的物体，还有很小的群体检测效果不好，这是因为一个网格中只能预测了一个