YoLo学习

目录

目标检测综述

预测阶段

预测阶段后处理-NMS非极大值抑制

训练阶段


目标检测综述

计算机视觉能解决的问题——分类,检测,分割

语义分割:只分类别

 

实例分割:区分同一类别的不同实例

 YoLo目标检测框架:

1.缩放图片

2.卷积网络

3.后处理

预测阶段

前向推断,只需预测模型。24层卷积层提取图像特征,两层全连接层回归

YoLo模型正向推断(测试过程)

1.将输入的图片划分为s*s个单元

2.标签ground truth框中心点落在哪个单元中,就应由哪个单元预测这个物体 

3.每个单元预测b个bounding boxs

4.最大的 bounding boxs负责预测这个物体

5.包含/不包含ground truth的以损失函数分别处理

6.直接获得向量,进行NMS后处理,得到目标检测结果

预测阶段后处理-NMS非极大值抑制

把重复的预测框只保留一个,最终获得目标预测的结果

 当选取了最大置信度的Bounding box之后,计算其余每个Bounding box与Bounding box的I ou值,经典NMS算法的做法是直接删除Iou大于阈值的Bounding box

训练阶段

梯度下降或反向传播方法迭代微调单元权重,使损失函数最小化,已经人工拟合出ground truth,通过损失函数最小化得出标准答案

损失函数:YOLO-V1算法最后输出的检测结果为7x7x30的形式,其中30个值分别包括两个候选框的位置和有无包含物体的置信度以及网格中包含20个物体类别的概率。那么YOLO的损失就包括三部分:位置误差,confidence误差,分类误差。损失函数的设计目标就是让坐标(x,y,w,h)confidenceclassification这个三个方面达到很好的平衡。

整个算法的损失是由预测框的坐标误差,有无包含物体的置信度误差以及网格预测类别的误差三部分组成,三部分的损失都使用了均方误差的方式来实现。 

 

 

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值