吴恩达《深度学习》第四课第三周

最新推荐文章于 2021-08-25 13:44:10 发布

冲动老少年

最新推荐文章于 2021-08-25 13:44:10 发布

阅读量1.2k

点赞数

分类专栏：吴恩达《深度学习》文章标签：目标检测 CNN 吴恩达

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013093426/article/details/81186671

版权

卷积神经网络——目标检测

3.1目标定位

1.分类与定位

分类问题可以有助于定位问题的解决，当识别完图片类型之后我们可以让神经网络的输出增加几个单元，从而输出一个边界框(bounding box)，具体而言就是多输出4个数字（b_x, b_y, b_h, b_w）,在这种情况下，输出将包含：一个分类标签，四个位置值

2.定义目标标签y

假设在分类任务中有4类：pedestrian（行人）、car（车辆）、motorcycle（机车），background（其他），这四类中如果输入图像不是前三类那么统统算作background，因此在标签y中需要设置一个参数P_c表征是否识别出物体，当P_c=1时，y=[P_c, b_x, b_y, b_h, b_w, C1, C2, C3],其中C1, C2, C3分别代表pedestrian（行人）、car（车辆）、motorcycle（机车），三者只有一个可为1，当P_c=0时，则不需要关心y中其他参数，相当于y=[P_c，?，?，?，？，？，？，？]

3.Loss函数L（y_hat, y）

有上图可知，我们只需考虑P_c=1时的情况，且通常只对边界框坐标应用平方误差或类似方法。

3.2特征点检测

1. 特征点检测

如3.1中输出物体边界框类似，如果我们想提取图片中的特

最低0.47元/天解锁文章

冲动老少年

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
吴恩达《深度学习》第四课第三周

卷积神经网络——目标检测3.1目标定位1.分类与定位分类问题可以有助于定位问题的解决，当识别完图片类型之后我们可以让神经网络的输出增加几个单元，从而输出一个边界框(bounding box)，具体而言就是多输出4个数字（b_x, b_y, b_h, b_w）,在这种情况下，输出将包含：一个分类标签，四个位置值2.定义目标标签y假设在分类任务中有4类：pedestrian（行...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。