参考书籍 《Robot Vision》 MIT机器视觉课程指定教材
机器视觉探究两个基本问题:
- 成像过程的基本原理是什么?
- 如何探索对成像过程“求逆”的基本知识和方法。
所谓“求逆”:具体来说,就是从一张图片、多张图片或者图像序列中恢复出关于场景或者观测者的信息。
基本研究方法:建立物理模型 ==> 导出数学公式 ==> 实现相应算法。
- 早期视觉:如何从图像中得到简单的符号描述。
- 后期视觉:如何使用这些简单的符号描述来生成一个复杂的结构化描述。
文章目录
第2章 成像与图像检测(感知 sensing)
- 1、图像是如何生成的?
通过分析从三维世界到二维图像平面的映射过程,我们知道关于成像的两个核心问题:- 是什么决定:物体表面某一点的像的位置?(图像投影)
- 是什么决定:物体表面所成的像的亮度?(图像辐射)
- 2、所生成的图像是如何被计算机感知的?
- 1)图像传感器的基本原理。
- 2)如何获取和处理不同频带上的信息。
2.1 成像的两个方面
- 图像是一个二维的亮度模式。
首先,我们需要知道:场景中的点和图像上的点之间的几何关系。
然后,我们需要弄清楚:是什么决定(图像中)该点的亮度。
2.1.1 透视投影(广角镜头)
- 所谓透视投影:图像的每个点都对应一个方向:即从一个点出发,穿过小孔的一条射线。光线沿这个射线传播,进行成像。
- 数学表达
[ x ˊ f ˊ , y ˊ f ˊ ] T = [ x z , y z ] T [{\acute{x}\over \acute{f}} ,{\acute{y}\over \acute{f}} ]^{T}= [{x\over z} , {y\over z} ]^{T} [fˊxˊ,