Yolo（1）Yolo v1

_(*^▽^*)_

已于 2023-03-30 22:33:41 修改

阅读量1k

点赞数 3

分类专栏： # Yolo 文章标签：深度学习人工智能神经网络

于 2021-10-20 15:15:28 首次发布

本文链接：https://blog.csdn.net/great_yzl/article/details/120817952

版权

Yolo 专栏收录该内容

3 篇文章 2 订阅

订阅专栏

一、基础理论

步骤1：生成备选框。

步骤2：从备选框中找出物体边框。

根据像素的突变，进行图像分割，分出不同物体，画出不同颜色的区域，得到备选框（proposal）。我们需要寻找的物体也在备选框中，我们需要把它从备选框中找出来。

优缺点

二、过程

1、对每张图像打格

图像打格过程中，物体中心落在哪个格子，那个格子就负责预测哪个物体。

：预测框。（Yolo v1预测2个边框，多预测几个边框，留下最好的那个）

：置信度（判断是否靠谱）（考虑两方面：(1)是某物体的概率；(2)重合的比例）)

：是某物体的概率。（最后结果在0~1之间）

：交并比（重合部分越高，交并比越大）

得到的Bounding Box五维数据：x、y、w、h、confidence。（横、纵坐标、宽、高、置信度）

（B不一定得是2）

以上的五个数据分别为：width * height * (5维 * Box数量B + Confidence)

2、损失函数

由于上面有3个物体，所以获取3个中心：

2-1、损失函数介绍

损失函数：坐标损失（Coordinate loss）、置信度损失（Confidence loss）、分类损失（Classification loss）。

上述4个式子分别计算：坐标、大小、物体、背景、分类概率的loss。

（这里）误差 = 预测 - 真实

2-2、参数介绍

（IoU：交并比）

object：学习物体：

no object：学习背景：

2-3、注意事项

注：

1、(2)式用根号压缩物体的原因：

        小物体和大物体的差距过大，尽可能压缩减小差距。（不压缩的话，loss会被大物体严重影响）

2、(4)式noobject（背景）原因：

        增强泛化能力。除了要学习物体的信息，我们还需要学习背景信息（有时候背景中可能有和原物体比较像的物体，但不是原物体，为了加以区分）（学习非物体的东西，提高泛化能力）。

3、(4)式加 $\lambda$ 的原因：

        为了减小背景的权重，因为背景通常更大，实际物体更小，所以背景会产生更多的损失。这样会导致网络去学习产生大loss的因素，即侧重于学习背景，而忽略掉学习物体的特征，这不是我们想要的。