CS231n:Localization and Detection(定位与检测)

  1. 分类与定位

    1. 作为回归问题的定位
      这里写图片描述

      1. 一般步骤
        1. 训练(或下载)一个分类网络
        2. 在网络后添加全连接regression head
          3.仅仅用SGD与L2 Loss 来训练网络
        3. 在测试时,计算两个网络
      2. 在确定总类别为C类的情况下训练网络.
        将定位的bounding box输出改为 C×4numbers 效果更好
        这里写图片描述

      3. 在何处加入 regression head
        这里写图片描述

      4. 同时定位(确定数目的)多目标
        假设在图像中定位给定K 个目标. 那么将regression head输出改为 K×4numbers
        应用于人的姿态检测(用K 个关节点来表示人的结构)

    2. 滑动窗口
      1. 一般步骤
        1. Run classification + regression network at multiple locations on a high resolution image (注意:在多尺度上运行窗口,同时定位出的bounding box, box可以超出图像(窗口)本身的大小),在下图中左上角窗口定位出的box超出了窗口本身,同时不仅输出了相应窗口,还输出了对应窗口的置信度
          这里写图片描述
        2. Convert fully-connected layers into convolutional layers for efficient computation 将CNN卷积特性直接用于了多尺度窗口计算,加快计算
          这里写图片描述
          对于这张图的流程与意义还不甚了解,求讲解
          这里写图片描述
          理解:将全连接层变为了卷积层,这样在检测时可以利用多尺度输入.如图,认为第一行网络是对于14*14的图像而言,输出了一个实数,代表测试样本属于某一类的概率,那么如第二行所示,输入了16*16的图像,最终输出2*2的矩阵,就是在利用14*14的窗口滑动对16*16的图像采样,输出的矩阵对用每个取样窗口的置信值
        3. Combine classifier and regressor predictions across all scales for final prediction**接上,对于每一个窗口,不仅有运行的分类网络,还有regressor net给出一个bounding box,这样,对每一个Bounding box 都有一个置信度与之对应,综合得到最后的分类与box**
  2. Detection检测(Output size inconstant)
    1. 作为分类问题来处理:划分多个尺度下的多个窗口,然后对每个窗口做分类
      1. HOG and DPM Need to test many positions and scales(对每个窗口提取特征值然后分类)
      2. using Region Proposals
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值