Convolutional Neural Networks--卷积神经网络(第三周)目标检测

图像检测定位:图像检测定位是一种有监督的学习的算法,输入值是图片,输出结果是,分类的需要分类的概率,边框中心bx,by的位置,边框的宽bw,边框的高bh,分类的结果

y1=0和y1=1的算是函数是有差异的,具体如下:

地标检测:是对图片中某些点作为标记,输出对应标记点的坐标。举例如下图:

滑动窗口目标检测器:先用仅包含检测目标的图片输入训练,识别是否包含监测目标。然后使用滑动窗口在图片中截取对应的图片,送入卷积层中判断是否包含监测目标,再调整滑块的大小和步幅再次遍历图片。这意味着滑块每次遍历图片,是非常大的计算量。具体距离如下:

全连接层使用卷积形式表示示意图如下:

应用卷积形式实现滑动窗口每一个,每一个单独的滑块计算流程以及扩展后整个图片的滑块计算流程示意图如下,但是这个方法有一个缺点,那就是窗口边框的定位并不精确 :

YoLo算法:首先把图片分为固定的小的部分,通过对每个块来去检测是否有要包含检测目标的中心点位置,如果包含则输出全部的向量,不包含就不再关心坐标以及边框。一个区域中有一个检测对象,效果一般还不错,但是同一个区域有多个监测对象,效果就会受到影响。示意图如下

交并比(Intersection Over Union):它既可以用来评价你的目标检测算法,也可以用于往目标检测算法中加入其他特征部分来进一步改善它。

交并比或者说是IoU函数做的就是 它计算了这两个边界框的交集除以并集的比率。

按惯例 或者说计算机视觉领域的原则, 如果IoU大于0.5你的结果就会被判断为正确的。如果预测的和真实的边界框完美重合了 

IoU就会是1 ,因为交集和并集是相同的 。但一般来说 只要IoU大于等于0.5 ,结果就可以了

 

Non-max Suppression:非极大值抑制是一种让你确保 你的算法只对每个对象得到一个检测的方法

 

首先要做的是丢掉所有预测值Pc小于或等于 某个界限的边界框

 如果还有剩下的边界框还没有被去掉或处理的,你将重复地选出有着最大概率 最大Pc值的边界框, 将它作为一个预测结果.

锚框(Anchor Boxes):你可以利用“锚框”(anchor box),对一个网格单元内的多个对象进行检测

怎么选择锚框呢?大家曾经是手动挑选, 可能涉及五或十个锚框 ,让它们有各种不同形状,看起来能涵盖你想侦测的物件种类 。而更进阶的版本 ,如果你有其他一些机器学习的知识 ,在后面会讲到的YOLO论文里会提到一个更好的方法 就是用一个K-means算法 。把两种像侦测的物体的形状集合起来 ,然后利用那个算法, 挑选出一些最具代表性的锚框 , 让它们能展现出想侦测的多种各个类别的物体.

算法过程如下

1、首先预定义一定数量的锚框

2、将锚框关联起来进行检测

具体过程如下图:

YoLo算法:

训练集中输入带有多个锚框标记的训练集,训练集中也分为多个specify the bounding boxes

输出出来在多个锚框标记的结果,使用非极大抑制值算法,把低于临界值的框删除

对每个类别分别运行非极大抑制值算法

说明图如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值