吴恩达深度学习笔记之卷积神经网络(目标检测)

3.1 目标定位

定位分类问题意味着我们不仅要用算法判断出图片中是否有该物体,还要标记出它的位置,例如图片有一辆汽车,我们需要用边框把汽车圈起来。
图像分类问题已不陌生,例如输入一张图片到多层卷积神经网络,它会输出一个特征向量,并反馈给softmax来预测图片类型。
比如某张图片包括以下几类,人,汽车,摩托车,背景。如果在该张图片中没有检测到对象,则输出结果就会是背景,这些分类就是softmax函数可能输出的结果。
如果还想定位图片中的汽车,行人等的位置,此时我们可以让神经网络多输出几个单元,输出一个边界框,具体来说就是让神经网络多输出四个数字,标记为bx,by,bh,bw分别代表边框的中心坐标,以及边框的长和宽,当然还可以有其他的表示方法。

定义以下标签

行人
汽车
摩托车
背景

注意:这里有4个分类,神经网络输出的是这 4个数字,和一个分类标签出现的概率。目标标签Y的定义如下:他是一个向量。如下所示: y=[pcbxbybhbwc1c2

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值