Reading_Andrew Ng-DL_目标检测

最新推荐文章于 2024-05-21 14:45:10 发布

馬冬梅啊

最新推荐文章于 2024-05-21 14:45:10 发布

阅读量203

点赞数

分类专栏：其他01

本文链接：https://blog.csdn.net/weixin_39782583/article/details/83714055

版权

7 篇文章 0 订阅

订阅专栏

目标检测：

1、 对象定位和特征点检测

目标检测的神经网络的目标标签和损失函数为：在这里插入图片描述

2、基于滑动窗口的目标检测算法。

定义：我们以某个步幅滑动这些方框窗口遍历整张图片，
对这些方形区域进行分类，判断里面有没有汽车。
在这里插入图片描述

缺点：计算量大粒度、步幅

3、卷积的滑动窗口实现

基于滑动窗口的目标检测算法的缺点：计算量大  粒度、步幅

卷积大小的转化公式：[(Number + 2Padding - Filter)/S步长] + 1

在卷积层上应用这个滑动检测算法。
为什么要将全连接层换成卷积层？？
1、把神经网络的全连接层转化成卷积层。具体操作就是用5*5的卷积核，将5*5的网络变成1*1的网络，就不是之前的全连接层了
在这里插入图片描述

可以看到输出了位置信息，并且不再限制输入图片的大小。

在这里插入图片描述

4、Bounding Box 预测和YOLO算法

滑动窗口法的卷积实现，这个算法效率更高，但仍然存在
问题，不能输出最精准的边界框

不同于卷积滑动检测，YOLO直接就是将输入的图片分成3*3 （也可以更精细，如19*19），输出3*3*8的矩阵。
在这里插入图片描述

- 如果一个对象横跨几个格子？
取对象的中点，分配在一个格子中（如上图的黄点）
- 如何界定框的参数，x , y , w ,h ?
定义格子左上这个点是(0,0)，然后右下这个点是(1,1) , 然后中点坐标和框的高度宽度都是相对于格子来说的

5、交并比（Intersection over union）

如何判断对象检测算法运作良好呢？

在这里插入图片描述

一般约定，在计算机检测任务中，如果??? ≥ 0.5，就说检测正确

6、非极大值抑制（Non-max suppression）

算法可能对同一个对象做出多次检测，
所以算法不是对某个对象检测出一次，而是检测出多次。非极大值抑   制这个方法可以
确保你的算法对每个对象只检测一次

在这里插入图片描述
如图，每个格子都觉得中心点在自己这里，如何选择最好的一个
步骤：

while循环：

注：之前一直不明白这个while循环有什么用，找到??最高的然后用交并比解决剩下的框不就行了，现在知道其实这是多目标检测，剩下的交并比低的框是别的目标的，然后在剩下的框中再选择对另一个目标概率最高的，重复上述步骤。
如下提图，很明显是检测了两个目标：在这里插入图片描述

7、 Anchor Boxes

 对象检测中存在的一个问题是每个格子只能检测出一个对象
 为了解决这个问题，使用 anchor box 这个概念

比如有两个anchor box ，检测每个目标都会默认输出两个格子，然后目标标签y为3*3*2*8，看目标的框与其中哪一个anchor box 的交并比高，就Pc = 1，否则为0.
也就是说，yolo的每一个格子都有两个(或多个)anchor box 在这里插入图片描述

看上图，第八个图，车和5号an box交并比高，所以y的下半部分的Pc = 1，检测为一个车，其他的部分dont care。

7、候选区域（选修）（Region proposals (Optional)
这是目标检测的另一个方向，不同于YOLO的you only look once ，这个还是沿袭之前的滑动窗法，代表算法是R-CNN等
在这里插入图片描述

如图，用分割算法（如聚类）先将图像分割成n块，再色块（其实也会输出一个边界框）上进行分类
两个步骤：proposal+classifier
得到色块（区域）–> 在色块上分类

R-CNN：用图像分割算法，得到区域，再逐一对区域分类（引进色块）
Fast - RCNN：分类用的是滑动窗法的一个卷积实现（改进classifier）
Faster - RCNN：用卷积神经网络，而不是更传统的分割算法来获得候选区域色块（改进proposal）

8、 YOLO算法

因为之前取地平线面试被问到YOLO的具体实现，
当时正值国庆high完，明明之前仔细看过，
但是还是忘得一干二净，所以要经常看，
现在把YOLO123都看一下。

关注

专栏目录