第一章 PPT
P11 什么是计算机视觉
采用计算机实现人类视觉功能,让计算机理解图像和视频 。
P12 计算机视觉与图像处理的区别
数字图像处理
图像/视频 -> 图像/视频 (图像变换、图像滤波、图像复原、图像压缩、…)
计算机视觉
图像/视频 -> 模型 (二维基素图 -> 2.5维要素图 -> 三维模型表征)
P14-20 计算机视觉中存在哪些难点和挑战
挑战:外观、大小和形状;复杂姿态/运动;复杂和不可预测的行为;噪声和遮挡;外观变化;上下文间依赖性;视点变化
P23-28 图像中存在哪些计算机视觉线索
深度线索:直线透视;空间透视
远近顺序线索:遮挡
形状线索:纹理梯度
形状和光照线索:阴影
位置和光照线索:投影
P30-46 计算机视觉有哪些典型应用
OCR(光学字符识别)、智能交通、人脸检测、表情识别、多视点三维重建、基于视觉的生物识别、辅助驾驶、无人驾驶汽车、基于视觉的人机交互、智能机器人、工业机器人
P48 CCD/CMOS传感器的成像原理:光电转换
P49-54 采样与量化影响图像的哪些属性
采样影响图像空间分辨率;量化影响图像幅度分辨率(灰度)
P61 图像坐标系
左上角为坐标原点
P75-78 像素距离与邻域关系
习题1.2 P19 计算机视觉要达到的目的有哪些?
答:计算机通过图像和视频对客观世界的感知、识别和理解;对场景进行解释和描述 ;根据对场景的解释和描述制定行为规划。
第三章 PPT
P11 薄透镜成像模型
P17-21 射影几何中哪些物理信息丢失和保留了?
丢失信息:长度、角度
保留信息:直线特性、交比不变性
P22-24 灭点和灭线的概念
场景中的平行线投影到图像平面后,会聚于“灭点”
灭线:灭点的集合
P46-49 像机成像过程中包含了哪些内参和外参?
P51 像机标定的目的,思路和基本方法
目的:确定像机的内参和外参。
思路:通过一组已知世界坐标的图像特征点,建立超定方程求解。
方法:最小二乘求解超定方程,寻找最优估计。
P63 径向畸变和切向畸变的概念
习题
第四章 PPT
P4-7 图像平移、尺度、旋转和级联变换
用矩阵乘实现级联变换
如图像依次进行平移、尺度和旋转变换,有
P14 最近邻插值
P16-18 双线性插值
P20-31 图像灰度映射
灰度映射原理
基于图像像素的点操作
映射函数
灰度映射的关键是根据增强要求设计映射函数
灰度映射:图像二值化、图像反色、动态范围压缩、对比度增强
P31-32 直方图的概念和意义,用已学过的数学原理进行解释
P40 直方图均衡计算
表4.3.1 L为灰度级数(本例为8)
-------------------------
原始图灰度级 0 1 2 3 4 5 6 7
原始直方图 0.02 0.05 0.09 0.12 0.14 0.2 0.22 0.16
累积直方图gf 0.02 0.07 0.16 0.28 0.42 0.62 0.84 1.0
四舍五入取整 0 0 1 2 3 4 6 7 注:int((L-1)*gf+0.5)
确定映射关系 0,1->0 2->1 3->2 4->3 5->4 6->6 7->7
新直方图 0.07 0.09 0.12 0.14 0.2 0 0.22 0.16
直方图均衡过程示例
P52-66 模板滤波的概念和理解
概念:利用像素本身以及其邻域像素的灰度关系进行图像增强的方法。
理解:1.滤波取自信号处理中的概念;2.滤波是在图像空间通过邻域操作完成的;3.邻域操作通常借助模板运算来实现
P69 中值滤波概念和基本步骤
概念:选择局部窗口中亮度的中间值代替窗口中心像素
步骤:
将模板中心与图像中某像素位置重合
读取模板下各对应像素的灰度值
将这些灰度值从小到大排成一列
找出这些灰度值里排在中间的一个
将这个中间值赋给对应模板中心位置像素
遍历图像中所有像素
P71 中值滤波与均值滤波的比较
中值滤波和线性滤波的区别:
1、中值滤波可有效消除突变,线性滤波总是响应所有的变化
2、中值滤波具有部分不连续保持特性,线性滤波会产生平滑过渡的效果
中值滤波和均值滤波的区别:
中值滤波器比均值滤波器更适合去除加性椒盐噪声
习题4.3 P75
设用三角形代替下图中的四边形,建立与下式相对应的校正几何形变的