机器视觉的发展和三个阶段描述

最新推荐文章于 2024-09-02 13:43:52 发布

jinyu3d

最新推荐文章于 2024-09-02 13:43:52 发布

阅读量237

点赞数

文章标签：计算机视觉

本文链接：https://blog.csdn.net/jinyu3d/article/details/131869169

版权

人们从外界环境获取的信总中，80%来自于视觉。人们的眼睛从自己周围的环境获取大量信总，并传入大脑后，由大脑根据知识或经验，对信息进行加工、推理等处理工作，最后识别、理解周围环境，包括环境内的对象物。

机器视觉就是用计算机模拟人眼的视觉功能，从图象或图象序列中提取信息，对客观世界的三维景物和物体进行形态和运动识别。机器视觉研究的目的之一就是要寻找人类视觉规律，从而开发出从图象输入到自然景物分析的图象理解系统。

对于机器视觉系统来说，输入是表示三维景物投影的灰度阵列，可以有若干个输入阵列，这些阵列可提供从不同方向、不同视角、不同时刻得到的信息。希望的输出，是对图象所代表景物的符号描述。通常这些描述是关于物体的类别和物体间的关系，但也可能包括如表面空间结构、表面物理特性（形状、纹理、颜色、材料)、阴影以及光源位置等信息。目前许多机器视觉专家都是在马尔(Marry)创立的视觉计算理论框架下求索。本世纪70年代中后期，英国的Marry教授应邀在美国麻省理工学院的人工智能实验室创建并领导一个以博士生为主体的研究小组，从事视觉理论方面的研究，逐步形成关于视觉的计算理论。Marry认为，视觉可分为三个阶段：第一阶段是早期视觉(early vision),其目的是抽取观察者周围景物表面的物理特性，如距离、表面方向、材料特性（反射、颜色、纹理)等，具体来说包括边缘检测、双目立体匹配、由阴影确定形状、由纹理确定形状、光流计算等：第二阶段是二维半简图（2.5 D sketch)或本征图象(Intrinsic Image),它是在以观察者为中心的坐标系中描述表面的各种特性，根据这些描述，可以重建物体边界、按表面和体积分割景物，但在以观察者为中心的坐标系中只能得到可见表面的描述，得不到遮挡表面的描述，故称二维半简图；第三阶段是三维模型（视觉信息处理的最后一个层次)，是用二维半简图中得到的表面信息建立适用于视觉识别的三维形状描述，这个描述应该与观察者的视角无关，也就是在以物体为中心的坐标系中，以各种符号和几何结构描述物体的三维结构和空间关系。