深度学习课程总结(stage3)

文章介绍了YOLO(YouOnlyLookOnce)系列算法在目标检测领域的应用,强调了其在检测速度上的提升。YOLOv7的性能尤为突出。目标检测涉及定位和分类问题,处理多物体、不同角度和尺寸的物体。文章提到了滑动窗口方法的局限性,以及YOLO通过一步法优化检测速度。此外,还讨论了YOLO的网络结构、损失函数和NMS算法在模型中的作用。
摘要由CSDN通过智能技术生成

一、YOLO系列算法介绍

1.目标检测

目标检测的本质就是先定位,再分类。主要问题如下:
(1)一张图片中可能有多个物体

(2)物体摆放的角度和姿态不定

(3)物体的尺寸变化大

 

 最终输出是一个向量,内容如下:

如果分类更多的话,可以扩张维度。

2.YOLO的发展史

本质上是检测速度的提升,在我的毕设中,涉及了YOLOv5和YOLOv7,其中YOLOv7的检测速度非常惊艳。

 3.目标检测的基本原理

(1)滑动窗口

 

 问题所在:滑动太慢,检测速度慢

 

 (2)两步法与一步法

 问题的解决:

 

 

 (3)YOLO网络结构

 

 YOLO检测原理:

 

以这个狗为例,有好多格子里面都可以检测到”狗“,但是我们选择的是狗的中心所在的那个格子。

 

其中30计算方法如下:每个cell有两个预测框,每个预测框五个属性,共能预测20个种类,所以一共输出维度为30,20个类别,由one-hot编码构成。

 

 Pr(obj)非0即1,其中gt(说白了就是标签)如图,我们可以看出选的确实是物体中心。

损失函数如下:

 NMS算法:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值