Ng深度学习笔记-卷积神经网络-目标检测

最新推荐文章于 2022-04-02 22:55:52 发布

CeciliaFinch

最新推荐文章于 2022-04-02 22:55:52 发布

阅读量247

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DoloresFinch/article/details/110352536

版权

本文详细介绍了卷积神经网络在目标检测中的应用，包括目标定位、特征点检测、滑动窗口的卷积实现、bounding box预测、交并比、非极大值抑制等关键技术。特别是，文章讨论了如何通过卷积网络改进滑动窗口算法，以及YOLO算法的原理和优势，如使用Anchor Boxes来检测多个目标。最后，文章对比了不同的区域提议方法，如R-CNN、Fast R-CNN和Faster R-CNN，强调了YOLO在效率上的提升。

摘要由CSDN通过智能技术生成

目标定位

符号表示：
图片左上角的坐标为 $(0, 0)$ ，右下角标记为 $(1, 1)$ 。
红色方框的中心点( $b_{x}$ , $b_{y}$ )，边界框的高度为 $b_{h}$ ，宽度为 $b_{w}$ 。

因此训练集不仅包含神经网络要预测的对象分类标签，还要包含表示边界框的这四个数字，接着采用监督学习算法，输出一个分类标签，还有四个参数值，从而给出检测对象的边框位置。

在这里插入图片描述

如何为监督学习任务定义目标标签 $y$ ：

这有四个分类，神经网络输出的是这四个数字和一个分类标签，或分类标签出现的概率。目标标签 $y$ 的定义如下： $\ \begin{bmatrix} p_{c} \\ b_{x} \\ b_{y} \\ b_{h} \\ b_{w} \\ c_{1} \\ c_{2}\\ c_{3} \end{bmatrix}$
第一个组件 $p_{c}$ 表示是否含有对象，如果对象属于前三类（行人、汽车、摩托车），则 $p_{c}= 1$ ，如果是背景，则图片中没有要检测的对象， $p_{c} =0$ 。我们可以这样理解 $p_{c}$ ，它表示被检测对象属于某一分类的概率，背景分类除外。

如果检测到对象，就输出被检测对象的边界框参数 $b_{x}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。