参考书籍 《Robot Vision》 MIT机器视觉课程指定教材
机器视觉探究两个基本问题:
- 成像过程的基本原理是什么?
- 如何探索对成像过程“求逆”的基本知识和方法。
所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。
基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。
- 早期视觉:如何从图像中得到简单的符号描述。
- 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。
第一章 简介
1.1 什么是机器视觉
- 一个与周围环境进行交互的大的实体的一部分。
- 工业应用中 视觉环境可控且所面临的任务是清晰明确的。
- 致力于构建一个在可控环境中处理特殊任务的系统,或者一些模块。
1.2 机器视觉的主要任务是什么
- 分析采集到的图像;针对某一明确任务,生成一个关于被成像物体(或者场景)的有效符号描述。这个描述将被用于指导机器人系统与周围环境进行交互。(有效符号描述是指:完成任务所需的全部信息。)
例如,机器视觉系统指导机器臂抓取传送带上的零件。视觉系统所要给出的描述包括:零件的位置、朝向以及种类。我们可能只需要几个数字,就能将这个描述表示清楚。 - 从某种意义上讲,视觉系统所要实现的任务可以被看作是成像的逆过程。