吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测

最新推荐文章于 2022-08-05 18:05:47 发布

lovecencen1893

最新推荐文章于 2022-08-05 18:05:47 发布

阅读量1.1k

点赞数

分类专栏：深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cluster1893/article/details/82156380

版权

吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测

吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测

3.1 目标定位（Object localization）

图像分类：
- 算法判断图像的内容是不是汽车。
目标定位：
- 算法判断图像是不是汽车，同时在图像中标记出车的位置。
目标检测：
- 图像中存在多个对象，算法检测出这些对象，并确定出位置。

目标定位：

符号约定：

图像左上角：（0，0）
图像右下角：（1，1）
bx、by：目标的中心点坐标；
bh、bw：目标的高度和宽度；

对目标定位任务，神经网络除了需要识别图像中的目标以外，还需要定位，所以神经网络的输出除了对图像的分类，还有图像的位置参数 $dx、dy、dh、dw$ 。

位置参数的理想值：
$dx=0.5、dy=0.7、dh=0.3、dw=0.4$

标签的定义：

网络现在有8个参数：

四个位置参数 $dx、dy、dh、dw$ ；
四个分类参数：行人、车、摩托、背景；

那么，标签 $y$ 的第一个参数 $p_c$ 表示：是否存在目标。

可以将 $p_c$ 理解为被检测图像属于某一分类的概率（分类1：存在目标，分类2，不存在目标）。

如果不存在目标，其他参数毫无意义。如果存在目标，再看其他参数。

损失函数：

损失函数分为存在目标和不存在目标两种情况。

因为在不存在目标时，其他七个参数没有意义。只需要考虑 $p_c$ 的准确度。

上图中，采用平方误差来说明损失函数在不同情况下的区别之处。

实际上，可以不用对softmax层输出的 $c_1、c_2、c_3$ 使用对数似然损失函数。通常做法是对坐标 dx、dy

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测

吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测吴恩达深度学习课程笔记（四）：卷积神经网络3 目标检测3.1 目标定位（Object localization）目标定位：标签的定义：损失函数：3.2 特征点检测（landmark detection）3.3 目标检测（object detection）3.4 卷积实现滑动窗口3.5 Bounding Bo...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。