Selective Search for Object Recognition

最新推荐文章于 2019-04-09 11:25:11 发布

surgewong

最新推荐文章于 2019-04-09 11:25:11 发布

阅读量2.5w

点赞数 24

分类专栏：物体识别文章标签： Selective Search Object Recognition 物体识别计算机视觉

本文链接：https://blog.csdn.net/surgewong/article/details/39316931

版权

本文介绍了选择性搜索（Selective Search）方法在物体识别中的应用，它通过图像分割和区域合并策略，解决了传统穷举搜索的耗时问题。论文提出多样化的策略，包括颜色、纹理和大小的相似度计算，提高了物体识别的效率和准确性。通过选择性搜索，可以快速获取物体位置的可能结果，为后续的物体识别任务提供了高效的前提。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Selective Search for Object Recoginition

surgewong@gmail.com

http://blog.csdn.net/surgewong

在前一段时间在看论文相关的工作，没有时间整理对这篇论文的理解。在前面的一篇博客【1】中有提到Selective Search【2】，其前期工作利用图像分割的方法得到一些原始区域（具体内容请查看【1】），然后使用一些合并策略将这些区域合并，得到一个层次化的区域结构，而这些结构就包含着可能需要的物体。

博客【3】已经有对这篇论文的一些简单介绍，写这篇博客不免有重复发明轮子之嫌，不想想太多，只想把自己的一些理解记录下来，加深自己的理解。

这篇论文是J.R.R. Uijlings发表在2012 IJCV上的一篇文章，主要介绍了选择性搜索（Selective Search）的方法。物体识别（Object Recognition），在图像中找到确定一个物体，并找出其为具体位置，经过长时间的发展已经有了不少成就。之前的做法主要是基于穷举搜索（Exhaustive Search），选择一个窗口（window）扫描整张图像（image），改变窗口的大小，继续扫描整张图像。显然这种做法是比较“原始的”，改变窗口大小，扫描整张图像，直观上就给人一种非常耗时，结果太杂的印象。作者能够突破思维定式，从另一个角度给出一种简单而又有效的方法，油生敬意。我们不禁会想，为什么这么简单的方法之前没有想到呢。我想这个应该跟对图像认识的观念有关系，在都不知道如何做物体识别（Object Recognition）的时候，较为“原始的”穷举搜索方法，给了大家一个方向，之后所有的人都沿着这个方向走，最后就忽略了对其他方向的认识。花费了这么多年，才找到另一个方向，这个转变实属不易。扯远了，总之，这种方法确实让人耳目一新。

一、介绍（Introduction）

图像（Image）包含的信息非常的丰富，其中的物体（Object）有不同的形状（shape）、尺寸（scale）、颜色（color）、纹理（texture），要想从图像中识别出一个物体非常的难，还要找到物体在图像中的位置，这样就更难了。下图给出了四个例子，来说明物体识别（Object Recognition）的复杂性以及难度。（a）中的场景是一张桌子，桌子上面放了碗，瓶子，还有其他餐具等等。比如要识别“桌子”，我们可能只是指桌子本身，也可能包含其上面的其他物体。这里显示出了图像中不同物体之间是有一定的层次关系的。（b）中给出了两只猫，可以通过纹理（texture）来找到这两只猫，却又需要通过颜色（color）来区分它们。（c）中变色龙和周边颜色接近，可以通过纹理（texture）来区分。（d）中的车辆，我们很容易把车身和车轮看做一个整体，但它们两者之间在纹理（texture）和颜色（color）方面差别都非常地大。

上面简单说明了一下在做物体识别（Object Recognition）过程中，不能通过单一的策略来区分不同的物体，需要充分考虑图像物体的多样性（diversity）。另外，在图像中物体的布局有一定的层次（hierarchical）关系，考虑这种关系才能够更好地对物体的类别（category）进行区分。

在深入介绍Selective Search之前，先说说其需要考虑的几个问题：