Contour Detection and Hierarchical Image Segmentation

最新推荐文章于 2019-11-22 19:25:28 发布

置顶

Q-沐风听雨-

最新推荐文章于 2019-11-22 19:25:28 发布

阅读量7.7k

点赞数 14

分类专栏：图像处理

本文链接：https://blog.csdn.net/nature_XD/article/details/53375344

版权

本文大部分内容来自下面的参考链接，加上自己对源代码和论文的一些理解。写下来以备后续查找！

一、论文原理分析

算法路线：gPb—->OWT—–>UCM

每一部分的功能：

gPb（Global Pb）：计算每一个pixel作为boundary的可能性，即pixel的weight；
OWT（Oriented Watershed Transform）将上述gPb的结果转换为多个闭合的regions；
UCM（Ultrametric Contour Map）将上述regions集，转换为hierarchical tree。

这里出现了很多名词，如：什么是hierarchical tree？什么是Oriented Watershed Transform。

1.1 gPb（Global Probability of Boundary）

gPb是mPb和sPb的加权和。
mPb是什么？sPb是什么？

- step1：计算G(x,y,θ)
对于每一个pixel，以其为圆心，做一个圆形：
globalPb计算过程示意图
用倾斜角为θ的直径，将圆形划分为两个区域，对于每一个区域中的pixels，做出它们的histogram，如下：
两个半圆的直方图
使用histogram数据，计算其卡方距离：
卡方距离公式
该距离即为G(x,y,θ)，代表pixel(x,y)以θ为方向的gradient magnitude；

- step2：计算mPb
普通的Pb算法，将一幅图片，分解为4个不同的feature channels，分别为brightness、color a、color b以及texture channel，其中前三个channels是基于CIE color space。

而每个pixel的weight就是由这4个channels下计算得到的G(x,y,θ)值的加权和。

针对普通的Pb算法，作者提出了multiscale的方法，即为mPb。

它的原理是在原有Pb算法的基础上，同时使用多个圆形直径长度δ（作者使用三个，[ δ/2 ,δ, 2δ]），针对每一个δ，计算其G（x，y，θ），最终公式如下：
mPb
公式中的i代表channel，s代表scale。
意思是，对于每一个pixel，我们计算其在不同直径条件下的每一个feature channel的和，作为其mPb值。
α代表每一个不同直径条件下的每一个feature channel的权重，是针对F-measure进行gradient ascent得到，使用的训练集是BSDS。

- step3：计算sPb
作者首先作出了一个sparse symmetric affinity matrix W，其中每一个元素Wij的计算如下：
Wij
i，j代表两个距离不超过半径r（单位：像素，作者在代码中设定r=5）的像素，p是两个像素连成的线段上的任意一个点，找到某两个pixel连成的线段上的pixel的weight的最大值。ρ是常数，作者代码中设定为ρ= 0.1。