YOLOV1论文笔记

最新推荐文章于 2023-01-01 00:53:46 发布

三大队的驴

最新推荐文章于 2023-01-01 00:53:46 发布

阅读量303

点赞数

文章标签：目标检测深度学习人工智能

本文链接：https://blog.csdn.net/weixin_43793381/article/details/121107070

版权

**一、专业名词解释

1、正例与负例
（1）True positives(TP): 被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数（样本数）；

（2）False positives(FP): 被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；

（3）False negatives(FN):被错误地划分为负例的个数，即实际为正例但被分类器划分为负例的实例数；

（4）True negatives(TN): 被正确地划分为负例的个数，即实际为负例且被分类器划分为负例的实例数。
2、精准率 precision
解释：预测样本中真正正例与所有“正例”的比值，也就是说被划为正例的样本中有几个是对的
表达公式P=TP/(TP+FP)
3、召回率 recall
解释：被正确划分的正例/所有真正例
表达公式：R=TP/(TP+FN)
4、准确率 Accuracy
解释：被正确划分的样本/所有样本
表达公式：ACC=(TP+TN）/(TP+FP+TN+FN)
5、平均精确度 AP
即 Average Precision
6、mAP
mAP 是 Mean Average Precision 的缩写，即均值平均精度。作为 object dection 中衡量检测精度的指标。计算公式为：

mAP = 所有类别的平均精度求和除以所有类别。

以上参考
原文链接：https://blog.csdn.net/shuiyixin/article/details/86349643
7、NMS（Non-Maximum Suppression，非最大值抑制
NMS算法基本步骤：
1、设定目标框的置信度阈值，常用的阈值是0.5左右
2、根据置信度降序排列候选框列表
3、选取置信度最高的框A添加到输出列表，并将其从候选框列表中删除
4、计算A与候选框列表中的所有框的IoU值，删除大于阈值的候选框
5、重复上述过程，直到候选框列表为空，返回输出列表

8、置信度（包含物体的概率）
置信度(confidence)=类概率*IoU
Pr⁡(Object)是边界框内存在对象的概率，若存在对象，Pr⁡(Object)=1，否则Pr⁡(Object)=0；IOU是真实框(ground truth)与预测框(predicted box)的交并比（交集/并集）。我们认为只有IoU>0.5的priorbox才是有价值的。
9、阈值
nms中的置信度阈值（confidence thresh）
执行检测会得到多组结果，我们设定一个置信度阈值。低于这个阈值的全部都置零
nms中的IOU阈值
从NMS算法筛选过后的候选框中选取置信度最大的Bounding box（假设为B），依次计算每个bounding box和B的IOU。删掉IOU大于阈值的候选框
10、鲁棒性

YOLO实现步骤
重新定义图片大小为448*448
调用python里的openCV库

将图像分割为S*S格，如果目标中心点落在一个网格内，那么这个网格负责检测该目标

置信度等于预测框与真实值之间联合部分的交集

网络的初始卷积层从图像
中提取特征，而全连接层预测输出概率和在这里插入图片描述
坐标。

我们的检测网络有24个卷积层，其次是2个全连接层。交替卷积层减少了前面层的特征空间。我们在ImageNet分类任务上以一半的分辨率（的输入图像）预训练卷积层，然后将分辨率加倍
来进行检测。

预测阶段（前向传播）
输入一张图片，判断类别返回结果
在这里插入图片描述
输入重新定义为448 * 448大小的图片后，返回7730的结果。
30是怎么来的，见下图

在这里插入图片描述
返回的结果为7730=1470个数字，这1470个数字反映了98个bounding boxs的位置，宽高，置信度和类别概率。对这1470个数字进行后处理就可以得到结果

后处理，置信度过滤、非最大值抑制
在这里插入图片描述

每个bounding box的置信度（包含物体的概率）*包含物体的条件下各个类别的概率=全概率（真正是哪个类别的概率）

每个框每个grid cell 有两个Bounding box,每个bounding box有五个值。
一共有7 * 7 * 2个20 * 1维数组，（其中20是每个bounding box的类别全概率）
对98个数组进行：低于阈值置零、排序、NMS
在这里插入图片描述
单独看一个类别时，得到一个1 * 98的一维数组。
用置信度最大的bounding box（设为A）依次计算别的bounding box的IOU，IOU大于阈值的置零（重复率太高的不要，这个阈值设的越低，nms算法越强）
当A和每个盒子依次计算IOU之后，将A从候选框剔除，添加到输出框。再从候选框里中找到置信度最大的bounding box，然后依次进行上述操作。最终输出框中的结果就是检测结果（注意，只是针对一个类别）。如下图。
在这里插入图片描述
有二十个类别就进行二十次NMS算法，最终返回一个稀疏矩阵（有特别多的0）。
训练阶段（反向传播）