平时我们都说要做视觉识别、测量云云,然后我们就会去拍照,再对数字图像做各种处理,颜色处理、灰度化、滤波、边缘检测、霍夫变换,最后得到了希望得到的特征,是这样的对吧?
不过请注意!到了这一步,其实我们仅仅是得到了一坨坨感兴趣的像素而已!究竟要怎样才能把这些像素转化到现实世界的对象中呢?也就是说,究竟要怎样对这些仅存在于图像中的东西进行测量,才能得到具有实际意义和尺度的数据呢?这个时候我们就懵逼了……
没错, 摄像机标定的存在意义就是解决这个问题!!!
我们继续看看,通过摄像机标定我们可以知道些什么:
1.外参数矩阵。告诉你现实世界点(世界坐标)是怎样经过旋转和平移,然后落到另一个现实世界点(摄像机坐标)上。
2.内参数矩阵。告诉你上述那个点在1的基础上,是如何继续经过摄像机的镜头、并通过针孔成像和电子转化而成为像素点的。
3.畸变矩阵。告诉你为什么上面那个像素点并没有落在理论计算该落在的位置上,还tm产生了一定的偏移和变形!!!
好了,到这里是不是明白了一点?上述3点的每一个转换,都有已经有成熟的数学描述,通过计算,我们完全可以精确地重现现实世界的任意一个点到其数字图像上对应像素点的投影过程。
对于双目视觉系统,通过立体标定还能进一步得到下面的参数:
4.结构参数。告诉你右摄像机是怎样相对于左摄像机经过旋转和平移达到现在的位置。
通过结构参数,便能把左右摄像机获取的图像的每一个像素点之间的关系用数学语言定量描述,保证两个相机都处于我们“可求”的状态。
总的来说,摄像机标定是通过寻找对象在图像与现实世界的转换数学关系,找出其定量的联系,从而实现从图像中测量出实际数据的目的。
当然,其实上述的各个转换过程大部分都不需要用户自己一个个写程序实现,比如opencv就集成了单目标定函数calibracamera()、畸变校正函数undistortinitialmap()、双目标定函数stereocalibrate()
其实自己亲自走一遍流程就很容易领会到整个视觉测量的逻辑。比如说,在畸变校正中需要用到单目标定的畸变参数输出和内参数输出,在双目标定中需要用到单目标定的外参数输出,在外极线校准中需要用到双目标定的结构参数输出,在立体匹配中中需要用到外极线校准的输出参数,在三维反求中需要用到立体匹配的输出参数。用户自己走完一遍这个流程,基本上就发现没有做标定的话,几乎什么都干不了。
通常我们在做3D视觉的时候,为了从2D图像中提取矩阵信息相机标定是相当有必要的一步。
典型的相机标定方法:
1)摄影测量的标定方法。 该方法通过观察3D空间的几何特性,拥有着相当好的精度。标定可以做到很好的效果。标定的对象需要两到三个正交的平面,这种方法需要高价的标定设备和精细的操作过程。
2)自标定方法。这种标定技术不需要使用任何标定的对象,仅仅需要在静态的场景当中移动相机