【计算机视觉】Object Proposal之BING理解

最新推荐文章于 2022-05-18 13:03:08 发布

Zhang_P_Y

最新推荐文章于 2022-05-18 13:03:08 发布

阅读量6.4k

点赞数 1

分类专栏：计算机视觉

计算机视觉专栏收录该内容

179 篇文章 40 订阅 ¥39.90 ¥99.00

订阅专栏

本文深入探讨BING算法如何通过梯度模式差异来区分物体与背景。在固定窗口大小下，物体的梯度分布较背景更为复杂。通过对大量训练图像的处理，使用级联SVM进行训练，实现物体检测的初步定位。

摘要由CSDN通过智能技术生成

发现：

本论文主要有两大亮点。第一个亮点是发现了在固定窗口的大小下，物体与背景的梯度模式有所不同。如图1所示。图1（a）中绿框代表背景，红框代表物体。如果把这些框都resize成固定大小，比如8X8，然后求出8X8这些块中每个点的梯度（Normed Gradient，本文的结果为[0,255],之前看错成Normalized...估计这里的normed就是指窗口都resize成8X8），可以明显看到物体与背景的梯度模式的差别，如图1（c）所示，物体的梯度分布呈现出较为杂乱的模式，而背景的较为单一和清楚。其实这个道理很浅显，就是图像中背景区域往往呈现出homogeneous的特性，早期的图像区域分割方法就是依靠这种特性来做的。然后我个人觉得这里不一定要用梯度，用其他一些统计特征甚至是图像特征都有可能得到类似的结果。

BING : Binarized Normed Gradients for Objectness Estimation at 300fps 论文笔记
找到上面的规律就好办了！

首先找一堆训练图像，（作者提供的图片集有许多，九千多张），每一个图片都有目标，并且目标所在的位置都在yml文件中标出来了，这样每一个图片有多个训练样本程序作者放到gtTrainBoxes和 gtTestBoxes（Ground truth bounding boxes for training and testing images）每个训练图像采集若干个窗口并resize到8X8的大小，然后将这些8X8的矩阵向量化得到若干个64维的向量，把这些向量扔进一个线性分类器去训练就ok了：

训练部分：采用级联的SVM 进行的训练。

作者分了两个阶段对训练样训练；

第一个阶段：

参考：http://blog.csdn.net/k123han123/article/details/25740355