基于图分割代码解读

点击打开链接

opencv支持的代码可以从上面的链接中下载。

论文的思想主要是基于两方面考虑,第一:像素之间的差异值,第二:图像分割之后的各个区域。其中区域大小是作为一个阈值来限制分割时的合并。下面简单介绍下图的一下基础。在一维矩阵中有两种连通方式,一种是四连通,也就是一个点和自身的上下左右是连通的,而另外一种是八连通,也就是一个点和自身周围的八个点是连通的。然而,不论是四连通还是八连通都有一个问题,那就是引起回路。不过在论文代码中引入一种很巧妙的方法来处理这个问题。利用四个相邻关系来描述八连通。

typedef struct {
  float w;
  int a, b;
} edge;
代码中定义一个变的结构体,其中,a和b代表像素点的坐标,而w则是a和b之间的差异值,差异值越小则更倾向于分为一类。a是当前像素值的位置,而b则是与a相邻的下一个像素点的位置。

  edge *edges = new edge[width*height*4];
  int num = 0;
  for (int y = 0; y < height; y++) {
	 for (int x = 0; x < width; x++) {
		if (x < width-1) {
			edges[num].a = y * width + x;
			edges[num].b = y * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y);
			num++;
      }

		if (y < height-1) {
			edges[num].a = y * width + x;
			edges[num].b = (y+1) * width + x;
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x, y+1);
			num++;
	 }

       if ((x < width-1) && (y < height-1)) {
			edges[num].a = y * width + x;
			edges[num].b = (y+1) * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y+1);
			num++;
      }

      if ((x < width-1) && (y > 0)) {
			edges[num].a = y * width + x;
			edges[num].b = (y-1) * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y-1);
			num++;
      }
    }
  }
上面是根据输入图像初始化一个八连通的图。首先根据像素的个数分配4倍的边来存储整个图中的连通关系。根据下面的图中a和b的赋值可以知道,整个图中不存在回路。因为每一个与a相邻的元素只和自身的右上方,右方,右下方以及下方的像素相邻,这样就不存在回路同时也做到了八连通(当所有的像素都以这种方式进行连通关系则可以保证是八连通)。经过上面的两层循环就得到了一个完整的图结构。
typedef struct {
	int rank;
	int p;
	int size;
} uni_elt;
利用得到的图结构就可以进行分割了,不过在介绍分割算法之前先看一个与分割相关的结构体。其中rank是可以作为两个区域合并的依据,p则是作为与当前元素相邻的元素以及区域的类别存在的,而size则是分割区域的大小。主要操作经过universe类别的find和join两个函数完成,当所有的循环结束时,整个区域就分割好了。得到一个较好的图像分割。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值