R-CNN大致分为两个步骤,一个是使用提出检测建议(detection proposals)的算法,另一个是使用神经网络对这些检测建议进行分类和融合。在R-CNN中用到的提出检测建议的算法是选择性搜索算法(selective search),这个算法分为两个大步骤,一个是使用图像分割算法把图像分为许多的小区域,另一个是对这些区域按照一定的准则进行融合形成更大的区域,并对这些区域生成相应的包围矩形(bounding boxes),即为最后的检测建议。选择性搜索算法第一步需要一个图像分割算法,更为具体的在论文中用到的就是这里将要介绍的Efficient Graph- Based Image Segmentation。
这篇文章是R-CNN的作者Ross Girshick的导师Pedro F. Felzenszwalb在图像分割领域做的一项工作,我们这里学习这篇文章是因为在R-CNN中用到的selective search算法中用到了这个分割算法作为基础。这篇论文的思想是把图像看作为一个图(graph),图中的节点就是图像中的像素,而权重就是相邻像素之间的差异性。然后通过贪心算法不断融合差异性小的像素或者区域为一个区域,将图最后划分为数个区域(regions或者是components),从而完成对图像的分割。
作者首先提出了如何衡量两个区域之间存在边界的证据(evidengce)的判断标准(predicate),随后在这个判断标准下提出了一种图像分割的算法,尽管这种算法采用了贪心的策略,但是它还是能够考虑到全局特征,产生出令人满意的分割结果。该算法的一个重要的性质是它能够在变化平缓的区域中保留住细节,而在变化剧烈的区域中忽略细节直接将其融合为一个区域。
让G=(V,E)成为一个无向图(graph),其中V是图像(图像指的是图片
R-CNN之前的准备:Efficient Graph-Based Image Segmentation
最新推荐文章于 2022-02-27 14:57:17 发布
本文介绍了R-CNN中用于生成检测建议的selective search算法所依赖的图像分割方法——Efficient Graph-Based Image Segmentation。该方法将图像视为图,通过衡量像素间的差异性,采用贪心策略进行区域融合,以实现图像分割。算法的关键在于判断两个区域是否应合并的标准,即区域内部差异性与区域间差异性的比较。文章还探讨了参数k对分割结果的影响,并展示了不同k值下的分割效果。
摘要由CSDN通过智能技术生成