R-CNN大致分为两个步骤,一个是使用提出检测建议(detection proposals)的算法,另一个是使用神经网络对这些检测建议进行分类和融合。在R-CNN中用到的提出检测建议的算法是选择性搜索算法(selective search),这个算法分为两个大步骤,一个是使用图像分割算法把图像分为许多的小区域,另一个是对这些区域按照一定的准则进行融合形成更大的区域,并对这些区域生成相应的包围矩形(bounding boxes),即为最后的检测建议。选择性搜索算法第一步需要一个图像分割算法,更为具体的在论文中用到的就是这里将要介绍的Efficient Graph- Based Image Segmentation。
这篇文章是R-CNN的作者Ross Girshick的导师Pedro F. Felzenszwalb在图像分割领域做的一项工作,我们这里学习这篇文章是因为在R-CNN中用到的selective search算法中用到了这个分割算法作为基础。这篇论文的思想是把图像看作为一个图(graph),图中的节点就是图像中的像素,而权重就是相邻像素之间的差异性。然后通过贪心算法不断融合差异性小的像素或者区域为一个区域,将图最后划分为数个区域(regions或者是components),从而完成对图像的分割。
作者首先提出了如何衡量两个区域之间存在边界的证据(evidengce)的判断标准(predicate),随后在这个判断标准下提出了一种图像分割的算法,尽管这种算法采用了贪心的策略,但是它还是能够考虑到全局特征,产生出令人满意的分割结果。该算法的一个重要的性质是它能够在变化平缓的区域中保留住细节,而在变化剧烈的区域中忽略细节直接将其融合为一个区域。
让G=(V,E)成为一个无向图(graph),其中V是图像(图像指的是图片
R-CNN之前的准备:Efficient Graph-Based Image Segmentation
最新推荐文章于 2022-04-15 22:30:41 发布