Efﬁcient Graph-Based Image Segmentation

最新推荐文章于 2024-09-05 15:35:57 发布

slothfulxtx

最新推荐文章于 2024-09-05 15:35:57 发布

阅读量287

点赞数

分类专栏：物体检测文章标签：计算机视觉

本文链接：https://blog.csdn.net/fnoi2014xtx/article/details/106780747

版权

物体检测专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Paper : Efﬁcient Graph-Based Image Segmentation
Code :

摘要

Efﬁcient Graph-Based Image Segmentation 一文是将图片看作是图论中的图进行处理，用到的方法比较简单易懂，涉及到OI/ACM中常见的概念MST，而类MST的算法流程保证算法的时间复杂度为O(n log n)。Efficient Graph-Based Image Segmentation 是在像素级上进行融合，为Selective Search 算法提供了初始的区域。

基于图的分割

设无向带权图 $G (V, E)$ 中 $w(v_i,v_j)$ 为非负实数，表示节点 $v_i,v_j$ 之间的差异度，那么基于图的分割方法中，分割 $S$ 定义为对点集 $V$ 的划分。

区域间边界断言(Pairwise Region Comparison Predicate) : 用于断言两区域之间是否有明确的证据表明存在边界。

对于区域 $C\in S$ ，定义区域 $C$ 的内部差异度为

$\textrm{Int}(C) = \max_{e\in MST(C,E)} w(e)$

对于区域 $C_1,C_2\in S$ ，定义它们之间的差异度为

$\textrm{Dif}(C_1,C_2) = \min_{v_i\in C_1,v_j\in C_2,(v_i,v_j)\in E w(v_i,v_j)}$

如果不存在连接两区域之间的边，令 $\textrm{Dif}(C_1,C_2) = \infty$

区域间边界断言定义为

$D(C_1,C_2) = \left\{\begin{matrix} \textrm{true} & \textrm{Dif}(C_1,C_2)>\textrm{MInt}(C_1,C_2)\\ \textrm{false} & \textrm{otherwise} \end{matrix}\right.$

其中最小内部差异值 MInt 定位为

$MInt(C_1,C_2) = \min(\textrm{Int}(C_1)+\tau(C_1),\textrm{Int}(C_2)+\tau(C_2))$

当 $∣ C ∣$ 较小时， $\textrm{Int}(C)$ 不是一个很好的评价局部数据性质的指标，例如 $∣ C ∣ = 1$ 时为0，因此引入阈值函数 $\tau$ ，定义为

$\tau(C) = \frac{k}{|C|}$

其中更大的超参数k，表示更倾向于生成更大的划分块。通过修改 $\tau$ 函数的定义，还可以表现出对区域形状的倾向性。

算法

过于细致的分割：对于分割 $S$ ，当存在区域 $C_1,C_2$ ，满足 $C_1,C_2$ 的区域间边界断言为假，我们称分割 $S$ 过于细致了。

过于粗糙的分割：对于分割 $S$ ，当存在对分割 $S$ 更细致的划分 $S^{'}$ ，且 $S^{'}$ 不是过于细致的分割，那么我们称分割 $S$ 过于粗糙了。

存在性：对于有限图 $G (V, E)$ ，存在一个分割 $S$ 不会过于细致或粗糙。

基于图的分割算法：

将边集根据边权 $w$ 由小到大排序 $\pi = (o_1...o_m)$ ，设 $S^0$ 表示初始分割，每个点自己组成一个区域
重复步骤3 m 次
根据以下方法从 $S^{q-1}$ 生成 $S^q$ ：设 $v_i \in C_i^{q-1},v_j \in C_j^{q-1}$ ，当 $C_i^{q-1}\not = C_j^{q-1}$ 且 $w(o_q) = w(v_i,v_j) \leq \textrm{MInt}(C_i^{q-1},C_j^{q-1})$ ，那么合并 $C_i^{q-1},C_j^{q-1}$ ，否则不变

可以证明，基于图的分割算法产生的分割 $S$ 不会过于细致或粗糙。

应用到图片上

图片可以理解成由像素构成的矩阵，可以有以下两种方式建图

使用高斯模糊 $\sigma = 0.8$ 对图片进行降噪后，令每个像素对应一个点，向八相邻的像素建边，权值为 $w(v_i,v_j) = |I(p_i)-I(p_j)|$ ，对于彩色图，我们对RGB分别处理，只将三个通道上都划分为一个区域的点看作一个区域。
使用高斯模糊 $\sigma = 0.8$ 对图片进行降噪后，将图片中每个像素映射到特征空间中，例如 $(x, y, r, g, b)$ ，使用 L₂ 正则作为距离函数，每个点连接固定数量的近邻

总结

基于图的分割算法给出了三个评价分割算法好坏的指标，并从数学上证明了算法的满足这三个标准。为了保证基于图的分割算法的时间复杂度是 O(n log n)的，作者使用了最大权重、最小权重等作为评价区域内、区域间的标准，可能会对算法的鲁棒性造成一定的影响。两种建图的方式一个更关注局部的特性，一个在感性上能够更关注图片的全局特性，可以根据实际问题进行调整。不过对于SS来说，前一种显然更优

slothfulxtx

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Efﬁcient Graph-Based Image Segmentation

Paper : Efﬁcient Graph-Based Image SegmentationCode :摘要Efﬁcient Graph-Based Image Segmentation 一文是将图片看作是图论中的图进行处理，用到的方法比较简单易懂，涉及到OI/ACM中常见的概念MST，而类MST的算法流程保证算法的时间复杂度为O(n log n)。Efficient Graph-Based Image Segmentation 是在像素级上进行融合，为Selective Search 算法提供.
复制链接

扫一扫

专栏目录