计算机视觉模型的研究与发展
第 26 卷第 2 期 信 息 与 控 制 V o l. 26,N o. 2
1997 年 4 月 In fo rm at ion an d Con t ro l A p r. , 1997
计算机视觉模型的研究与发展
龙甫荟 郑南宁
( 西安交通大学人工智能与机器人研究所 西安 7 10049)
摘 要 按照什么模型发展计算机视觉是当前急待明确又极富争议的问题. 本文介绍了以
M ar r 框架为基础的传统通用视觉模型并分析了它潜在的问题, 阐述了目的视觉模型的特点及一
些重要的研究课题, 在此基础上, 提出我们对通用视觉与 目的视觉之争的一些看法, 最后对计算机
视觉进一步研究应重视的领域提出一些建议.
关键词 计算机视觉, 通用视觉, 目的视觉,M ar r 框架
1 引言
计算机视觉的研究内容包括两方面, 一是如何利用计算机实现部分人类视觉的功能, 二是
帮助理解人类视觉机理. 本世纪 70 年代M ar r 提出的视觉计算理论是该领域至今为止唯一较
为完整的理论框架, 为广大计算机视觉研究者所遵循, 在取得极大成功的同时, 也面临一些困
难, 越来越多的计算机视觉研究者对传统的基于M ar r 框架的通用视觉提出挑战, 主张基于 目
的面向各种应用的视觉模型研究框架, 由此展开了计算机视觉究竟沿着怎样的模型框架发展
的争论.
2 传统的通用视觉(Gen era l V ision ) 模型
通用视觉模型以 理论为核心, 其 目的在于寻求 3 世界的通用模型表示.
M ar r D
2. 1 框架
M ar r
[ 1 ]
M ar r 视觉计算理论将视觉过程看成是一个信息加工的过程 , 包括 3 个不同的层次, 即
视觉的计算理论层、表示与算法层以及硬件实现层, 分别回答视觉处理过程的输入和输出及输
入输出之间的约束、输入输出的表示和应采取的相应算法以及物理上如何实现这种表示与算
法等问题. M ar r 强调了当时不受重视的计算理论层次, 并在这一层上将视觉过程主要规定为
从 2 图象中定量地恢复出图象所反映出的场景中的 3 物体的形状和空间位置. 进一
D D M ar r
步将视觉过程分为早期、中期、后期 3 个阶段, 早期视觉由输入图象获得要素图, 包括图象中强
度变化剧烈处的位置、几何分布和组织结构等; 中期视觉实现由输入图象、要素图获得 2. 5
D
图, 即在以观察者为中心的坐标系中, 可见表面的法向、深度及不连续轮廓等, 视觉的这一过程
由一系列处理 的相对独立的模块组成; 后期视觉由输入图象、要素图及 2. 5
Sh ap e from X D
图获得物体的 3 表示, 即在以物体为中心的坐标系中, 含有体积面积基元的模块化的分层表
D
示及各物体之间的空间关系表示等.
2. 2 框架的缺陷
M ar r
近 30 年来,M ar r 视觉计算理论取得了巨大成功, 包括计算理论层上发现了许多重要的基
本约束、数据结构算法层上发展了各种算法以及建立起一些早期视觉的实验系统等, 但它也存
1996- 05- 03 收稿
2 期 龙甫荟等: 计算机视觉模型的研究与发展