kinect学习笔记四(距离变换 distance tranform 和opencv像素访问方式)

最新推荐文章于 2024-07-10 13:14:47 发布

timebomb

最新推荐文章于 2024-07-10 13:14:47 发布

阅读量2.2w

点赞数 4

分类专栏：模式识别项目总结文章标签： distance float null c dst 编程

本文链接：https://blog.csdn.net/timebomb/article/details/7474331

版权

模式识别项目总结专栏收录该内容

17 篇文章 2 订阅

订阅专栏

当时自己理解的一点小误区，放到这里防止再犯错。

距离变换的基本意思就是计算一个图像中非零像素点到最近的零像素点的距离，也就是到所有零像素点的最短距离。建立距离变换图像可以方便提取骨骼

在opencv中有专门的函数cvDistTransform来计算距离变换图像。

DistTransform
计算输入图像的所有非零元素对其最近零元素的距离

void cvDistTransform( const CvArr* src, CvArr* dst, int distance_type=CV_DIST_L2,
                      int mask_size=3, const float* mask=NULL );
src
输入 8-比特、单通道 (二值) 图像.
dst
含计算出的距离的输出图像(32-比特、浮点数、单通道).
distance_type
距离类型; 可以是 CV_DIST_L1, CV_DIST_L2, CV_DIST_C 或 CV_DIST_USER.
mask_size
距离变换掩模的大小，可以是 3 或 5. 对 CV_DIST_L1 或 CV_DIST_C 的情况，参数值被强制设定为 3, 因为 3×3 mask 给出 5×5 mask 一样的结果，而且速度还更快。
mask
用户自定义距离距离情况下的 mask。 在 3×3 mask 下它由两个数(水平/垂直位量，对角线位移量）组成， 5×5 mask 下由三个数组成(水平/垂直位移量，对角位移和 国际象棋里的马步(马走日)) 
函数 cvDistTransform 二值图像每一个象素点到它最邻近零象素点的距离。对零象素，函数设置 0 距离，对其它象素，它寻找由基本位移（水平、垂直、对角线或knight's move，最后一项对 5×5 mask 有用）构成的最短路径。 全部的距离被认为是基本距离的和。由于距离函数是对称的，所有水平和垂直位移具有同样的代价 (表示为 a ), 所有的对角位移具有同样的代价 (表示为 b), 所有的 knight's 移动具有同样的代价 (表示为 c). 对类型 CV_DIST_C 和 CV_DIST_L1，距离的计算是精确的，而类型 CV_DIST_L2 (欧式距离) 距离的计算有某些相对误差 (5×5 mask 给出更精确的结果), OpenCV 使用 [Borgefors86] 推荐的值：

CV_DIST_C (3×3):
a=1, b=1

CV_DIST_L1 (3×3):
a=1, b=2

CV_DIST_L2 (3×3):
a=0.955, b=1.3693

CV_DIST_L2 (5×5):
a=1, b=1.4, c=2.1969

其中mask刚开始不是很理解，经过模拟数据得到了其含义。

距离计算
2b	?	2a		b
?	b	a	b	?
2a	a	0	a	2a
?	b	a	b	?
b	?	a	?	b

a\b分别表示在水平垂直方向的距离，？/问号部分表示根据a和b的值的大小再确定其值。
如果定义了c值（用户自定义mask或者选择CV_DIST_L2等）在变为

a,b,c
2b	c	2a	c	2b
c	b	a	b	c
2a	a	0	a	2a
c	b	a	b	c
2b	c	2a	c	2b

所以定义c的时候必须是5*5的mask，然后在往外扩充的时候类似上面的问号类型，找到最小距离即可。

下面代码表示自己创建一个9*9的矩阵，然后利用该函数计算其值：

//距离变换代码，在微软的那个ppt中用来计算掌心的位置可能用到这个
//部分内容在http://www.opencv.org.cn/forum/viewtopic.php?f=1&t=4574&start=0有解释

#include <iostream>
#include "highgui.h"
#include "cv.h"

using namespace std;

int main()
{
	
	IplImage *src = cvCreateImage(cvSize(9, 9), 8, 1);
	cvZero(src);
	uchar *ptr = (uchar*)(src->imageData);
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0; *ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255;*ptr++ = 255; *ptr++ = 0;*ptr++ = 0;ptr +=3;
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 255;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0; ptr +=3;
	*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;*ptr++ = 0;

	IplImage *dist = cvCreateImage( cvGetSize(src), IPL_DEPTH_32F, 1 );
	cvDistTransform( src, dist, CV_DIST_L1, 3, NULL, NULL );
	/*cvConvertScale( dist, dist, 1000.0, 0 );
	cvShowImage("dist2", dist);
	cvPow( dist, dist, 0.5 );
	cvShowImage("dist3", dist);
	IplImage *dist32s = cvCreateImage(cvGetSize(src), IPL_DEPTH_32S, 1);
	cvConvertScale( dist, dist32s, 1.0, 0.5 );
	cvShowImage("dist32s", dist32s);
	cvAndS( dist32s, cvScalarAll(255), dist32s, 0 );
	cvShowImage("dist32s2", dist32s);
	IplImage *dist8u1 = cvCloneImage(src);
	cvConvertScale( dist32s, dist8u1, 1, 0 );
	cvShowImage("dist8u1", dist8u1);*/

	for (int y=0; y<src->height; y++)
	{
		uchar *pt = (uchar*)(src->imageData+y*src->widthStep);
		for (int x=0; x<src->width; x++)
		{
			cout << int(pt[x]) << '\t';
		}
		cout << endl;
	}
	cout << endl << endl;
	for (int y=0; y<dist->height; y++)
	{
		float *p = (float *)(dist->imageData+y*dist->widthStep);//因为输出图像必须是浮点型数据，所以这里必须采用float。也是自己一开始做错的。虽然IplImage->imageData是char型的，但是针对不同类型（字节型浮点型）要有不同的处理方式
		for (int x=0; x<dist->width; x++)
		{
			cout << float(p[x]) << '\t';
		}
		cout << endl;
	}

	cvShowImage("src",src);
	cvShowImage("dist", dist);
	cvWaitKey(0);
	return 0;

}

运行结果

如果将距离运算改为CV_DIST_L2运行结果：

因为一开始栽倒数据访问上了，所以有必要将opencv中像素访问方式贴出来，方便以后查阅。csnd编辑界面太差了，一堆乱码，大家还是移步到:http://www.opencv.org.cn/index.php/OpenCV_编程简介（矩阵/图像/视频的基本读写操作）

timebomb

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
7
评论
kinect学习笔记四(距离变换 distance tranform 和opencv像素访问方式)

当时自己理解的一点小误区，放到这里防止再犯错。距离变换的基本意思就是计算一个图像中非零像素点到最近的零像素点的距离，也就是到所有零像素点的最短距离。建立距离变换图像可以方便提取骨骼在opencv中有专门的函数cvDistTransform来计算距离变换图像。DistTransform计算输入图像的所有非零元素对其最近零元素的距离void cvDistTransform(
复制链接

扫一扫

专栏目录