图像处理、立体视觉等等方向常常涉及到四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系。例如下图:
构建世界坐标系只是为了更好的描述相机的位置在哪里,在双目视觉中一般将世界坐标系原点定在左相机或者右相机或者二者X轴方向的中点,不过一般我们都是选择左相机的原点。
接下来重点就是关于这几个坐标系的转换,也就是说,一个现实中的物体的点,是如何在图像中成像的
1.世界坐标系到相机坐标系
于是,从世界坐标系到相机坐标系,涉及到旋转和平移(其实所有的运动也可以用旋转矩阵和平移向量来描述)。绕着不同的坐标轴旋转不同的角度,得到相应的旋转矩阵,如下图所示:
这样的话我们就能表示从世界坐标系到相机坐标系的转换关系如下:
在这里运用了一个非齐次坐标到齐次坐标的转换,
2相机坐标系到图像坐标系
从相机坐标系到图像坐标系,属于透视投影关系,从3D转换到2D,如下图所示,根据相似三角形,我们能都得到从相机坐标系到图像坐标系之间的关系;
此时投影点p的单位还是mm,并不是pixel,需要进一步转换到像素坐标系。
1.3图像坐标系到像素坐标系
像素坐标系和图像坐标系都在成像平面上,只是各自的原点和度量单位不一样,著作权归作者所有。图像坐标系的原点为相机光轴与成像平面的交点,通常情况下是成像平面的中点或者叫principal point。图像坐标系的单位是mm,属于物理单位,而像素坐标系的单位是pixel,我们平常描述一个像素点都是几行几列。所以这二者之间的转换如下:其中dx和dy表示每一列和每一行分别代表多少mm,即1pixel=dx mm 其中 uov代表的是像素坐标系,xoy代表的是图像坐标系;
其中相机的内参和外参可以通过张正友标定获取。通过最终的转换关系来看,一个三维中的坐标点,的确可以在图像中找到一个对应的像素点,但是反过来,通过图像中的一个点找到它在三维中对应的点就很成了一个问题,因为我们并不知道等式左边的Zc的值。
参考文章:http://www.cvvision.cn/8305.html