双目视觉是利用左右两个摄像机同步成像,再利用实际场景中远近物体在左右相机中成像的差异进行测距的视觉感知方法。近的物体,在左右相机中的成像位置差异较大,远的物体在左右相机中的成像位置差异比较小。
这种仿生视觉感知系统类似于公司观赏3D电影,通过偏光镜片,左眼看左相机的图像,右眼看右相机的图像,通过大脑理解视觉差异从而形成具有真实远近关系的立体感觉。
双目视觉要做的是仿生技术加人工智能计算、精密制造三位一体的工作。难度在于如何时时刻刻维持各种温度、各种场景下近乎完美的经过计算的每部双目相机的立体视觉几何模型,如果视觉几何模型发生变化,视觉推理计算的结果就可能不可控。
立体视觉的原理很简单,但稳定地实现起来却很难。
在三维立体视觉中,成像环境中的X、Y、Z三维信息都可以通过立体视觉的精确测距能力进行恢复。所有现实世界的每一点的X、Y、Z三维信息,都和两个摄像机之间的基线长度,每个镜头经过标定之后的焦距,以及该点在双目相机成像中对应的成像点对的视觉差异有关。
为什么说视觉测距有难度?通过立体相机测距,越近的物体的在左右相机的视觉差异,也即视差的区分度越大,越远的物体的视差区分度越小。也就是说做一个双目相机,随着稳定有效的测距距离达到50米以上、100米以上、150米以上,难度就会越来越大,