目标检测（Object detection）

最新推荐文章于 2022-02-27 13:25:55 发布

lml77

最新推荐文章于 2022-02-27 13:25:55 发布

阅读量377

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lml77/article/details/88739399

版权

*目标定位（Object localization）
*特征点检测（Landmark detection）
*目标检测（Object detection）
*卷积的滑动窗口实现
*YOLO算法
*非极大值抑制
*Anchor Boxes

一、目标定位（Object localization）
在这里插入图片描述
多个不同分类的对象。因此，图片分类的思路可以帮助学习分类定位，而对象定位的思路又有助于学习对象检测，我们先从分类和定位开始讲起。

分类定位:
在这里插入图片描述

目标标签?:

图片中没有检测对象的情况:

神经网络的损失函数:

二、特征点检测（Landmark detection）
在这里插入图片描述

标签训练集（人为辛苦标注）:

三、目标检测（Object detection）
汽车检测:
在这里插入图片描述
滑动窗口目标检测算法:

总有一个窗口可以检测到汽车:

滑动窗口目标检测算法的缺点:

四、卷积的滑动窗口实现
4分类（行人、汽车、摩托车和背景）:
在这里插入图片描述
卷积的滑动窗口实现:

在这里插入图片描述

五、YOLO算法
在这里插入图片描述
YOLO算法:

指定边界框:

六、非极大值抑制
交并比:
在这里插入图片描述
非极大值抑制:

非极大抑制是怎么起效的？:
我们分步介绍一下非极大抑制是怎么起效的，因为你要在361个格子上都运行一次图像检测和定位算法，那么可能很多格子都会举手说我的??，我这个格子里有车的概率很高，而不是361个格子中仅有两个格子会报告它们检测出一个对象。所以当你运行算法的时候，最后可能会对同一个对象做出多次检测，所以非极大值抑制做的就是清理这些检测结果。这样一辆车只检测一次，而不是每辆车都触发多次检测。
所以这就是非极大值抑制，非最大值意味着你只输出概率最大的分类结果，但抑制很接近，但不是最大的其他预测结果，所以这方法叫做非极大值抑制。
在这里插入图片描述

七、Anchor Boxes
在这里插入图片描述

训练:

预测:

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。