YoLo学习

最新推荐文章于 2024-10-08 20:32:22 发布

贺和和

最新推荐文章于 2024-10-08 20:32:22 发布

阅读量142

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Heyuhangxing/article/details/120223496

版权

目录

目标检测综述

预测阶段后处理-NMS非极大值抑制

目标检测综述

计算机视觉能解决的问题——分类，检测，分割

语义分割：只分类别

实例分割：区分同一类别的不同实例

YoLo目标检测框架：

1.缩放图片

2.卷积网络

3.后处理

预测阶段

前向推断，只需预测模型。24层卷积层提取图像特征，两层全连接层回归

YoLo模型正向推断（测试过程）

1.将输入的图片划分为s*s个单元

2.标签ground truth框中心点落在哪个单元中，就应由哪个单元预测这个物体

3.每个单元预测b个bounding boxs

4.最大的 bounding boxs负责预测这个物体

5.包含/不包含ground truth的以损失函数分别处理

6.直接获得向量，进行NMS后处理，得到目标检测结果

预测阶段后处理-NMS非极大值抑制

把重复的预测框只保留一个，最终获得目标预测的结果

当选取了最大置信度的Bounding box之后，计算其余每个Bounding box与Bounding box的I ou值，经典NMS算法的做法是直接删除Iou大于阈值的Bounding box

训练阶段

梯度下降或反向传播方法迭代微调单元权重，使损失函数最小化，已经人工拟合出ground truth，通过损失函数最小化得出标准答案

损失函数：YOLO-V1算法最后输出的检测结果为7x7x30的形式，其中30个值分别包括两个候选框的位置和有无包含物体的置信度以及网格中包含20个物体类别的概率。那么YOLO的损失就包括三部分：位置误差，confidence误差，分类误差。损失函数的设计目标就是让坐标(x,y,w,h)，confidence，classification这个三个方面达到很好的平衡。

整个算法的损失是由预测框的坐标误差，有无包含物体的置信度误差以及网格预测类别的误差三部分组成，三部分的损失都使用了均方误差的方式来实现。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。