基于图分割代码解读

最新推荐文章于 2021-03-17 21:44:04 发布

轩动day

最新推荐文章于 2021-03-17 21:44:04 发布

阅读量829

点赞数

分类专栏： C++ 文章标签：图像分割

本文链接：https://blog.csdn.net/dayenglish/article/details/42833901

版权

C++ 专栏收录该内容

34 篇文章 0 订阅

订阅专栏

点击打开链接

opencv支持的代码可以从上面的链接中下载。

论文的思想主要是基于两方面考虑，第一：像素之间的差异值，第二：图像分割之后的各个区域。其中区域大小是作为一个阈值来限制分割时的合并。下面简单介绍下图的一下基础。在一维矩阵中有两种连通方式，一种是四连通，也就是一个点和自身的上下左右是连通的，而另外一种是八连通，也就是一个点和自身周围的八个点是连通的。然而，不论是四连通还是八连通都有一个问题，那就是引起回路。不过在论文代码中引入一种很巧妙的方法来处理这个问题。利用四个相邻关系来描述八连通。

typedef struct {
  float w;
  int a, b;
} edge;

代码中定义一个变的结构体，其中，a和b代表像素点的坐标，而w则是a和b之间的差异值，差异值越小则更倾向于分为一类。a是当前像素值的位置，而b则是与a相邻的下一个像素点的位置。

  edge *edges = new edge[width*height*4];
  int num = 0;
  for (int y = 0; y < height; y++) {
	 for (int x = 0; x < width; x++) {
		if (x < width-1) {
			edges[num].a = y * width + x;
			edges[num].b = y * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y);
			num++;
      }

		if (y < height-1) {
			edges[num].a = y * width + x;
			edges[num].b = (y+1) * width + x;
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x, y+1);
			num++;
	 }

       if ((x < width-1) && (y < height-1)) {
			edges[num].a = y * width + x;
			edges[num].b = (y+1) * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y+1);
			num++;
      }

      if ((x < width-1) && (y > 0)) {
			edges[num].a = y * width + x;
			edges[num].b = (y-1) * width + (x+1);
			edges[num].w = diff(rgb[0], rgb[1], rgb[2], x, y, x+1, y-1);
			num++;
      }
    }
  }

上面是根据输入图像初始化一个八连通的图。首先根据像素的个数分配4倍的边来存储整个图中的连通关系。根据下面的图中a和b的赋值可以知道，整个图中不存在回路。因为每一个与a相邻的元素只和自身的右上方，右方，右下方以及下方的像素相邻，这样就不存在回路同时也做到了八连通（当所有的像素都以这种方式进行连通关系则可以保证是八连通）。经过上面的两层循环就得到了一个完整的图结构。

typedef struct {
	int rank;
	int p;
	int size;
} uni_elt;

利用得到的图结构就可以进行分割了，不过在介绍分割算法之前先看一个与分割相关的结构体。其中rank是可以作为两个区域合并的依据，p则是作为与当前元素相邻的元素以及区域的类别存在的，而size则是分割区域的大小。主要操作经过universe类别的find和join两个函数完成，当所有的循环结束时，整个区域就分割好了。得到一个较好的图像分割。