卷积神经网络(三)- 目标检测

本次学习笔记主要记录学习深度学习时的各种记录,包括吴恩达老师视频学习、花书。作者能力有限,如有错误等,望联系修改,非常感谢!


第一版       2022-07-18        初稿

一、目标定位(Object localization)

在这里插入图片描述
图片分类任务是算法遍历图片,判断对象是不是汽车;
次节为定位分类问题,不仅有单个的定位和分类,还有多个对象的定位。
在这里插入图片描述
图片分类并不陌生,输入图片到卷积神经网络,输出一个特征向量,反馈给softmax单元来预测图片类型。

若正在构建汽车自动驾驶系统,对象可能包括:行人、汽车、摩托车和背景。定位可以让神经网络多输出4个数字,记为bx,by,bh,bw,是被监测对象的边界框的参数化表示。
图左上角为(0,0),右下角为(1,1),确定边界框具体位置,需指定红色方框的中心点(bx,by),边界框高度bh,宽度bw。
在这里插入图片描述
为监督学习任务定义目标标签:
目标标签y的定义如下: y = ( p c b x b y b h b w c 1 c 2 c 3 ) y=\left( \begin{array}{l} pc\\ bx\\ by\\ bh\\ bw\\ c1\\ c2\\ c3\\ \end{array} \right) y=<

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值