相机将三维世界中的坐标点(单位为米)映射到二维图像平面(单位为像素),这个映射过程可以用一个几何模型表示。接下来讲讲几何模型中最简单的针孔模型。
- 针孔相机模型
图1 针孔相机模型
设相机坐标系为o-x-y-z,习惯上z轴朝前,y轴朝下,x轴朝右。o为光心,也就是针孔模型中的针孔。
接下来给这个针孔模型做个解释:现实三维世界中一点P,经过小孔O投影后,落到物理成像平面上上,成像点为,设P点的坐标为,坐标为,设光心O到物体成像平面的距离为焦距f,根据相似三角形可得公式(1):
图2 相似三角形
为了简化模型,可以把成像平面挪到相机前面,整理可得公式(2):
公式(2)得到了三维空间点P和它的像之间的空间关系,但是在图像中,往往用像素来表示,所以还需要在成像平面上进行采样和量化,设在物理成像平面上固定着一个像素平面o-u-v,于是可得的像素坐标:。
那么像素坐标系是如何定义的呢?
像素坐标系的定义为:原点位于图像的左上角(物理成像平面的位于正中间),u轴向右与x轴平行,v轴向下与y轴平行。像素坐标系和成像平面之间,相差一个缩放和原点的平移。
设在u轴缩放α倍,在v轴缩放β倍,原点的平移为,于是与像素坐标之间的关系为:
合并一下可得:
把上式写成矩阵形式:
把Z挪到左侧:
其中K矩阵称为相机的内参矩阵,内参矩阵是指世界坐标系下的点转到像素坐标系下的几何模型。
除了内参以外,自然还有相机外参,在前面式子的推导中,使用的P都是相机坐标系下的坐标,由于相机是不断的在运动的,所以P的相机坐标应该是世界坐标系根据相机的位姿,变换到相机坐标系下的结果。相机的位姿由它的旋转矩阵R和平移矩阵t表示。那么即有
注意:此处的T是
其中T称为变换矩阵,描述的是世界坐标系到像素坐标系的投影关系。