Reading_Andrew Ng-DL_目标检测

目标检测:

1、 对象定位和特征点检测

目标检测的神经网络的目标标签和损失函数为:在这里插入图片描述
在这里插入图片描述

  • 更概括地说,神经网络可以通过输出图片上的特征点的坐标来实现对目标特征的识别
  • 选定特征点个数,并生成包含这些特征点的标签训练集,然后利用神经网络输出脸部关键特征点的位置。
  • 人体姿态检测也是同样的道理,选取一些关键特征点,如胸部的中点,左肩,左肘,腰等等

2、基于滑动窗口的目标检测算法。

定义:我们以某个步幅滑动这些方框窗口遍历整张图片,
对这些方形区域进行分类,判断里面有没有汽车。
在这里插入图片描述

缺点:计算量大 粒度、步幅

3、 卷积的滑动窗口实现

基于滑动窗口的目标检测算法的缺点:计算量大  粒度、步幅

卷积大小的转化公式:[(Number + 2Padding - Filter)/S步长] + 1

在卷积层上应用这个滑动检测算法。
为什么要将全连接层换成卷积层??
1、把神经网络的全连接层转化成卷积层。具体操作就是用5*5的卷积核,将5*5的网络变成1*1的网络,就不是之前的全连接层了
在这里插入图片描述

可以看到输出了位置信息,并且不再限制输入图片的大小。

在这里插入图片描述

4、Bounding Box 预测和YOLO算法

滑动窗口法的卷积实现,这个算法效率更高,但仍然存在
问题,不能输出最精准的边界框

不同于卷积滑动检测,YOLO直接就是将输入的图片分成3*3 (也可以更精细,如19*19),输出3*3*8的矩阵。
在这里插入图片描述

- 如果一个对象横跨几个格子?
取对象的中点,分配在一个格子中(如上图的黄点)
- 如何界定框的参数,x , y , w ,h ?
定义格子左上这个点是(0,0),然后右下这个点是(1,1) , 然后中点坐标和框的高度宽度都是相对于格子来说的

5、交并比(Intersection over union)

如何判断对象检测算法运作良好呢?

在这里插入图片描述

一般约定,在计算机检测任务中,如果??? ≥ 0.5,就说检测正确

6、非极大值抑制(Non-max suppression)

算法可能对同一个对象做出多次检测,
所以算法不是对某个对象检测出一次,而是检测出多次。非极大值抑   制这个方法可以
确保你的算法对每个对象只检测一次

在这里插入图片描述
如图,每个格子都觉得中心点在自己这里,如何选择最好的一个
步骤:

while循环:

  1. 将所有的预测值,所有的边界框??小于或等于某个阈值,比如?? ≤ 0.6的边界框去掉。选择概率??最高的边界框,然后把它输出成预测结果
  2. 接下来去掉所有剩下的边界框,把这些和输出边界框有高重叠面积和上一步输出边界框有很高交并比的边界框全部抛弃,比如IoU>=0.5得框去掉。
  3. 在剩下的未处理的框中重复上述的步骤,知道找出所有的预测结果

注:之前一直不明白这个while循环有什么用,找到??最高的然后用交并比解决剩下的框不就行了,现在知道其实这是多目标检测,剩下的交并比低的框是别的目标的,然后在剩下的框中再选择对另一个目标概率最高的,重复上述步骤。
如下提图,很明显是检测了两个目标:在这里插入图片描述

7、 Anchor Boxes

 对象检测中存在的一个问题是每个格子只能检测出一个对象
 为了解决这个问题,使用 anchor box 这个概念

比如有两个anchor box ,检测每个目标都会默认输出两个格子,然后目标标签y为3*3*2*8,看目标的框与其中哪一个anchor box 的交并比高,就Pc = 1,否则为0.
也就是说,yolo的每一个格子都有两个(或多个)anchor box在这里插入图片描述

看上图,第八个图,车和5号an box交并比高,所以y的下半部分的Pc = 1,检测为一个车,其他的部分dont care。

7、候选区域(选修)(Region proposals (Optional)
这是目标检测的另一个方向,不同于YOLO的you only look once ,这个还是沿袭之前的滑动窗法,代表算法是R-CNN等
在这里插入图片描述

如图,用分割算法(如聚类)先将图像分割成n块,再色块(其实也会输出一个边界框)上进行分类
两个步骤:proposal+classifier
得到色块(区域)–> 在色块上分类

R-CNN:用图像分割算法,得到区域,再逐一对区域分类(引进色块)
Fast - RCNN:分类用的是滑动窗法的一个卷积实现(改进classifier)
Faster - RCNN:用卷积神经网络,而不是更传统的分割算法来获得候选区域色块(改进proposal)

8、 YOLO算法

因为之前取地平线面试被问到YOLO的具体实现,
当时正值国庆high完,明明之前仔细看过,
但是还是忘得一干二净,所以要经常看,
现在把YOLO123都看一下。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值