YOLOV1论文笔记

**一、专业名词解释

1、正例与负例
(1)True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);

(2)False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;

(3)False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;

(4)True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。
2、精准率 precision
解释:预测样本中真正正例与所有“正例”的比值,也就是说被划为正例的样本中有几个是对的
表达公式P=TP/(TP+FP)
3、召回率 recall
解释:被正确划分的正例/所有真正例
表达公式:R=TP/(TP+FN)
4、准确率 Accuracy
解释:被正确划分的样本/所有样本
表达公式:ACC=(TP+TN)/(TP+FP+TN+FN)
5、平均精确度 AP
即 Average Precision
6、mAP
mAP 是 Mean Average Precision 的缩写,即 均值平均精度。作为 object dection 中衡量检测精度的指标。计算公式为:

mAP = 所有类别的平均精度求和除以所有类别。

以上参考
原文链接:https://blog.csdn.net/shuiyixin/article/details/86349643
7、NMS(Non-Maximum Suppression,非最大值抑制
NMS算法基本步骤:
1、设定目标框的置信度阈值,常用的阈值是0.5左右
2、根据置信度降序排列候选框列表
3、选取置信度最高的框A添加到输出列表,并将其从候选框列表中删除
4、计算A与候选框列表中的所有框的IoU值,删除大于阈值的候选框
5、重复上述过程,直到候选框列表为空,返回输出列表

8、置信度(包含物体的概率)
置信度(confidence)=类概率*IoU
Pr⁡(Object)是边界框内存在对象的概率,若存在对象,Pr⁡(Object)=1,否则Pr⁡(Object)=0;IOU是真实框(ground truth)与预测框(predicted box)的交并比(交集/并集)。我们认为只有IoU>0.5的priorbox才是有价值的。
9、阈值
nms中的置信度阈值(confidence thresh)
执行检测会得到多组结果,我们设定一个置信度阈值。低于这个阈值的全部都置零
nms中的IOU阈值
从NMS算法筛选过后的候选框中选取置信度最大的Bounding box(假设为B),依次计算每个bounding box和B的IOU。删掉IOU大于阈值的候选框
10、鲁棒性

YOLO实现步骤
重新定义图片大小为448*448
调用python里的openCV库

将图像分割为S*S格,如果目标中心点落在一个网格内,那么这个网格负责检测该目标

置信度等于预测框与真实值之间联合部分的交集

网络的初始卷积层从图像
中提取特征,而全连接层预测输出概率和在这里插入图片描述
坐标。
在这里插入图片描述
我们的检测网络有24个卷积层,其次是2个全连接层。交替 卷积层减少了前面层的特征空间。我们在ImageNet分类任务上以一半的分辨率( 的输入图像)预训练卷积层,然后将分辨率加倍
来进行检测。

预测阶段(前向传播)
输入一张图片,判断类别返回结果
在这里插入图片描述
输入重新定义为448 * 448大小的图片后,返回7730的结果。
30是怎么来的,见下图
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
返回的结果为7730=1470个数字,这1470个数字反映了98个bounding boxs的位置,宽高,置信度和类别概率。对这1470个数字进行后处理就可以得到结果

后处理,置信度过滤、非最大值抑制
在这里插入图片描述
在这里插入图片描述
每个bounding box的置信度(包含物体的概率)*包含物体的条件下各个类别的概率=全概率(真正是哪个类别的概率)

每个框每个grid cell 有两个Bounding box,每个bounding box有五个值。
一共有7 * 7 * 2个20 * 1维数组,(其中20是每个bounding box的类别全概率)
对98个数组进行:低于阈值置零、排序、NMS
在这里插入图片描述
单独看一个类别时,得到一个1 * 98的一维数组。
用置信度最大的bounding box(设为A)依次计算别的bounding box的IOU,IOU大于阈值的置零(重复率太高的不要,这个阈值设的越低,nms算法越强)
当A和每个盒子依次计算IOU之后,将A从候选框剔除,添加到输出框。再从候选框里中找到置信度最大的bounding box,然后依次进行上述操作。最终输出框中的结果就是检测结果(注意,只是针对一个类别)。如下图。
在这里插入图片描述
有二十个类别就进行二十次NMS算法,最终返回一个稀疏矩阵(有特别多的0)。
训练阶段(反向传播)

利用反向传播和梯度下降法迭代的微调神经元中的权重,使得损失函数最小化(预测值更接近预测框)
在这里插入图片描述
在这里插入图片描述
为了避免过拟合采用dropout,dropout就是在训练过程中随即掐死一半的神经元。使得输出和反向传播回来的梯度都为0
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值