吴恩达深度学习笔记之卷积神经网络(目标检测)

最新推荐文章于 2024-06-16 11:02:33 发布

置顶

物理小乾乾

最新推荐文章于 2024-06-16 11:02:33 发布

阅读量2.7k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LIUSHAO123456789/article/details/78847926

版权

3.1 目标定位

定位分类问题意味着我们不仅要用算法判断出图片中是否有该物体，还要标记出它的位置，例如图片有一辆汽车，我们需要用边框把汽车圈起来。
图像分类问题已不陌生，例如输入一张图片到多层卷积神经网络，它会输出一个特征向量，并反馈给softmax来预测图片类型。
比如某张图片包括以下几类，人，汽车，摩托车，背景。如果在该张图片中没有检测到对象，则输出结果就会是背景，这些分类就是softmax函数可能输出的结果。
如果还想定位图片中的汽车，行人等的位置，此时我们可以让神经网络多输出几个单元，输出一个边界框，具体来说就是让神经网络多输出四个数字，标记为bx,by,bh,bw分别代表边框的中心坐标，以及边框的长和宽，当然还可以有其他的表示方法。

定义以下标签

行人
汽车
摩托车
背景

注意：这里有4个分类，神经网络输出的是这 4个数字，和一个分类标签出现的概率。目标标签Y的定义如下：他是一个向量。如下所示： y=[pcbxbybhbwc1c2

最低0.47元/天解锁文章

物理小乾乾

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习笔记之卷积神经网络(目标检测)

3.1 目标定位定位分类问题意味着我们不仅要用算法判断出图片中是否有该物体，还要标记出它的位置，例如图片有一辆汽车，我们需要用边框把汽车圈起来。图像分类问题已不陌生，例如输入一张图片到多层卷积神经网络，它会输出一个特征向量，并反馈给softmax来预测图片类型。比如某张图片包括以下几类，人，汽车，摩托车，背景。如果在该张图片中没有检测到对象，则输出结果就会是背景，这些分类就是softmax函
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。