BING:Binarized Normed Gradients for Objectness Estimation at 300fps 总结

刚刚接触目标检测的东西,这篇文章转载过其他人的笔记,但是总觉得 应该自己写一下


“Regionlets for Generic Object Detection”有一段话:

Object detection is composed of two key components: determing where the candidate locations are in images and
discerning whether they are the objects of interests.

这是目标检测的两个重要组成部分。


本文基于一个事实:人在观察物体的时候并非像sliding window那样一点一点的处理,而是只处理了视野内的少部分信息提前进行了预测。所以Training a generic objectness measure to produce a small set of candidate object windows是很有必要的。


文中有两个重要创新点:1)发现了NG特征下,目标与背景状态的不同;2)二进制的加速手段。

详细内容可以参考:http://blog.csdn.net/u012290039/article/details/32704273

这里做简单的总结,所谓NG就是把不同box的梯度resize成8*8大小,作为特征;所谓BING就是对其进行二值化,仅用简单的ADD和bitwise shift处理,加快速度(计算一个window的objectness score仅需2个float乘法,一个float加法,十来个bitwise operation。)。然后用LinearSVM学习方法处理。在减少候选框的情况下获得很高的DR;比PAMI2012, PAMI 2013, IJCV 2013  的方法快了1000倍,测试速度达300个图像每秒。


文章最后提出了一些问题:

像绳子蛇这样的目标问题矩形框的描述并不准确;

跟文中引用的[18]结合实现实时检测;

在不降低DR的情况下,减少proposals的数量。


个人感觉理解的并不透彻,以后如果有所启发,继续完善

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值