R-CNN之前的准备：Efficient Graph-Based Image Segmentation

最新推荐文章于 2022-02-27 14:57:17 发布

熊彬程的博客

最新推荐文章于 2022-02-27 14:57:17 发布

阅读量1.9k

点赞数

分类专栏：深度学习-目标检测深度学习-目标检测算法从RCNN到SSD 文章标签： RCNN segment 神经网络

本文链接：https://blog.csdn.net/xbcReal/article/details/75897836

版权

本文介绍了R-CNN中用于生成检测建议的selective search算法所依赖的图像分割方法——Efficient Graph-Based Image Segmentation。该方法将图像视为图，通过衡量像素间的差异性，采用贪心策略进行区域融合，以实现图像分割。算法的关键在于判断两个区域是否应合并的标准，即区域内部差异性与区域间差异性的比较。文章还探讨了参数k对分割结果的影响，并展示了不同k值下的分割效果。

摘要由CSDN通过智能技术生成

      R-CNN大致分为两个步骤，一个是使用提出检测建议(detection proposals)的算法，另一个是使用神经网络对这些检测建议进行分类和融合。在R-CNN中用到的提出检测建议的算法是选择性搜索算法(selective search)，这个算法分为两个大步骤，一个是使用图像分割算法把图像分为许多的小区域，另一个是对这些区域按照一定的准则进行融合形成更大的区域，并对这些区域生成相应的包围矩形(bounding boxes)，即为最后的检测建议。选择性搜索算法第一步需要一个图像分割算法，更为具体的在论文中用到的就是这里将要介绍的Efficient Graph- Based Image Segmentation。
      这篇文章是R-CNN的作者Ross Girshick的导师Pedro F. Felzenszwalb在图像分割领域做的一项工作，我们这里学习这篇文章是因为在R-CNN中用到的selective search算法中用到了这个分割算法作为基础。这篇论文的思想是把图像看作为一个图(graph)，图中的节点就是图像中的像素，而权重就是相邻像素之间的差异性。然后通过贪心算法不断融合差异性小的像素或者区域为一个区域，将图最后划分为数个区域(regions或者是components)，从而完成对图像的分割。
      作者首先提出了如何衡量两个区域之间存在边界的证据(evidengce)的判断标准(predicate)，随后在这个判断标准下提出了一种图像分割的算法，尽管这种算法采用了贪心的策略，但是它还是能够考虑到全局特征，产生出令人满意的分割结果。该算法的一个重要的性质是它能够在变化平缓的区域中保留住细节，而在变化剧烈的区域中忽略细节直接将其融合为一个区域。
      让G=（V，E）成为一个无向图（graph），其中V是图像（图像指的是图片