一、YOLO系列算法介绍
1.目标检测
目标检测的本质就是先定位,再分类。主要问题如下:
(1)一张图片中可能有多个物体
(2)物体摆放的角度和姿态不定
(3)物体的尺寸变化大
最终输出是一个向量,内容如下:
如果分类更多的话,可以扩张维度。
2.YOLO的发展史
本质上是检测速度的提升,在我的毕设中,涉及了YOLOv5和YOLOv7,其中YOLOv7的检测速度非常惊艳。
3.目标检测的基本原理
(1)滑动窗口
问题所在:滑动太慢,检测速度慢
(2)两步法与一步法
问题的解决:
(3)YOLO网络结构
YOLO检测原理:
以这个狗为例,有好多格子里面都可以检测到”狗“,但是我们选择的是狗的中心所在的那个格子。
其中30计算方法如下:每个cell有两个预测框,每个预测框五个属性,共能预测20个种类,所以一共输出维度为30,20个类别,由one-hot编码构成。
Pr(obj)非0即1,其中gt(说白了就是标签)如图,我们可以看出选的确实是物体中心。
损失函数如下:
NMS算法: