第三周:目标检测

本文是卷积神经网络的笔记。

3.1 目标定位(Object Localization)

  • Classification with localization: 把一个物体在图像中框出来
  • Detection:把图像中所有物体框出来(可以是不同的类别)

下面我们考虑一个分类问题,类别为:

  1. pedestrain
  2. car
  3. motorcycle
  4. background
    其中前面3类,我们称为图像中有物体。

记号:

  • 图片左上角记为(0,0),右下角记为(1,1),竖着为y轴
  • 框(Bounding Box)左上角为 ( b x , b y ) (b_x,b_y) (bx,by),框的高度和宽度 ( b h , b w ) (b_h,b_w) (bh,bw)
  • 输出:(一个分成3类的例子)
    y = [ P c b x b y b h b w c 1 c 2 c 3 ] y=\begin{bmatrix} Pc \\ b_x \\ b_y \\ b_h \\ b_w \\ c_1 \\ c_2 \\ c_3 \end{bmatrix} y=Pcbxbybhbwc1c2c3
    其中 P c Pc Pc是图片中有物体的概率, b x , b y , b h , b w b_x,b_y,b_h,b_w bx,by,bh,bw对应Bounding Box的左上角和框的高度和宽度。 c 1 , c 2 , c 3 c_1,c_2,c_3 c1,c2,c3为属于三个类别的概率。

例如

  • y = [ 1 b x b y b h b w 0 1 0 ] y=\begin{bmatrix} 1 \\ b_x \\ b_y \\ b_h \\ b_w \\ 0 \\ 1 \\ 0 \end{bmatrix} y=1bxbybhbw010可以框出图像中的汽车。
    y = [ 0 ? ? ? ? ? ? ? ] y=\begin{bmatrix} 0 \\ ? \\ ? \\ ? \\ ? \\ ? \\ ? \\ ? \end{bmatrix} y=0???????

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值