目标检测(Object detection)

*目标定位(Object localization)
*特征点检测(Landmark detection)
*目标检测(Object detection)
*卷积的滑动窗口实现
*YOLO算法
*非极大值抑制
*Anchor Boxes

一、目标定位(Object localization)
在这里插入图片描述
多个不同分类的对象。因此,图片分类的思路可以帮助学习分类定位,而对象定位的思路又有助于学习对象检测,我们先从分类和定位开始讲起。

分类定位:
在这里插入图片描述
在这里插入图片描述
目标标签?:
在这里插入图片描述
图片中没有检测对象的情况:
在这里插入图片描述
神经网络的损失函数:
在这里插入图片描述

二、特征点检测(Landmark detection)
在这里插入图片描述
在这里插入图片描述
标签训练集(人为辛苦标注 ):
在这里插入图片描述

三、目标检测(Object detection)
汽车检测:
在这里插入图片描述
滑动窗口目标检测算法:
在这里插入图片描述
总有一个窗口可以检测到汽车:
在这里插入图片描述
滑动窗口目标检测算法的缺点:
在这里插入图片描述

四、卷积的滑动窗口实现
4分类(行人、汽车、摩托车和背景):
在这里插入图片描述
卷积的滑动窗口实现:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

五、YOLO算法
在这里插入图片描述
YOLO算法:
在这里插入图片描述
在这里插入图片描述
指定边界框:
在这里插入图片描述

六、非极大值抑制
交并比:
在这里插入图片描述
非极大值抑制:
在这里插入图片描述
在这里插入图片描述
非极大抑制是怎么起效的?:
我们分步介绍一下非极大抑制是怎么起效的,因为你要在361个格子上都运行一次图像检测和定位算法,那么可能很多格子都会举手说我的??,我这个格子里有车的概率很高,而不是361个格子中仅有两个格子会报告它们检测出一个对象。所以当你运行算法的时候,最后可能会对同一个对象做出多次检测,所以非极大值抑制做的就是清理这些检测结果。这样一辆车只检测一次,而不是每辆车都触发多次检测。
所以这就是非极大值抑制,非最大值意味着你只输出概率最大的分类结果,但抑制很接近,但不是最大的其他预测结果,所以这方法叫做非极大值抑制。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

七、Anchor Boxes
在这里插入图片描述
在这里插入图片描述
训练:
在这里插入图片描述
预测:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值