文档下载地址(免费)https://download.csdn.net/download/qq_38314289/12362996
第一章
1、计算机视觉:
研究用计算机来模拟生物视觉功能的科学和技术。
2、视觉表示框架的三个阶段(也就是提取三阶段):
1)第一阶段是将输入的原始图像进行处理,抽取基本特征形成基元图。
2)第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,形成二维半图。
3)第三阶段(后期阶段)是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。
第三章
1、二值图像的特点:
1)假定二值图像大小为mxn,其中物体像素值为1,背景像素值0;
2)二值图像处理的算法简单,易于理解和实现,计算速度快;
3)二值视觉所需的内存小,对计算设备要求低;
4)二值视觉系统技术可用于灰度图像视觉系统。
2、二值图像的获取:
1)通过图像的阙值
2)通过硬件实现
3)通过软件实现
3、图像分割:
把图像划分成区域,使每一个区域都对应一个候选的目标。
4、图像二值化:
设一副灰度图像中物体的灰度分布在某一区间内,通过阙值运算后的图像为二值图像 。
5、投影分类及作用:
1)水平/垂直投影;给定直线上的投影;对角线投影(仿射变换) 2)投影能表现图像的某种信息。
6、4-连通成分序贯法(标记算法)步骤:
1)从左到右 ,从上到下扫描图像;
2)①如果上面点和左面点有一个标记,复制这一标记
②如果两点相同的标记,复制这一标记
③如果两点有不同标记,则复制上点标记且将两个标记输入到等价表中作为等价标记
④否则给这一像素点分配一个新的标记并将这个标记输入到等价表 ;
3)如考虑更多的点,回到第二步;
4)在等价表中的每一等价集中找到最低的标记 ;
5)扫描图像,用等价表中的最低标记取代每一个标记。
7、欧拉数:
E=C-H,连通成分数©-空洞数(H)
8、扩展与收缩:
1)要掌握用结构元进行扩展与收缩
2)先扩展后收缩:补上不希望存在的洞
3)先收缩后扩展:去除孤立的噪声点
4)定义:
①扩展:如果背景和洞的像素点临点显1,则该点从0变为1
②收缩:如果物体像素点连点为0,则将该点从1变为0
9、开、关运算:
1)开运算:先腐蚀后膨胀,去除比结构元小的区域的像素点
2)关运算:显膨胀后腐蚀,填充比结构元小的孔洞
第四章
图像增强:
所用的图像预处理方法并不考虑图像降质原因,只将图像中感兴趣的特征有选择地突出,衰减其不需要的特征,故预处理后的输出图像并不需要去逼近原图像.
图像增强技术主要有两种方法: 空间域法和频率域法.
直方图均衡化 是一种通过重新均匀地分布各灰度值来增强图像对比度的方法.
直方图修正 能提高图像的主观质量,因此在处理艺术图像时非常有用.
1、常见的噪声:
常见的噪声有椒盐(Salt & Pepper)噪声、脉冲噪声、高斯噪声等
2、常见的滤波器:
均值滤波器,高斯平滑滤波器,非线性滤波器(包括中值滤波器,边缘保持滤波器)
均值滤波和高斯滤波运算的主要问题: 有可能模糊图像中的尖锐不连续部分.
3、高斯平滑滤波的5条性质:
1)旋转对称性
2)高斯函数是单值函数
3)高斯函数的付立叶变换频谱是单瓣的
4)高斯滤波器宽度由参数σ表征
5)高斯函数的可分离性
第五章
1、边缘:
边缘是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域之间
2、图像强度的不连续可分为:
- 阶跃不连续,即图像强度在不连续处的两边的像素灰度值有着显著的差异;
- 线条不连续,即图像强度突然从一个值变化到另一个值,保持一较小行程后又回到原来的值
3、术语定义:
边缘点(Edge point) :在亮度显著变化的位置上的点.
边缘段(Edge segment) :对应于边缘点坐标及其方位.
边缘检测器(Edge detector) :从图像中抽取边缘集合的算法.
轮廓(Boundary) :边缘列表或一条表示边缘列表的拟合曲线.
边缘连接(Edge linking) :从无序边缘表形成有序边缘表的过 程. 边缘跟踪(Edge tracking):一个用来确定轮廊的图像搜索过程.
4、边缘检测算法基本步骤:
1)滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能.需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声之间需要折衷.
2)增强:增强边缘的基础是确定图像各点邻域强度的变化值.增强算法可以将邻域(或局部)强度值有显著变化的点突显出来.边缘增强一般是通过计算梯度幅值来完成的.
3)检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点.最简单的边缘检测判据是梯度幅值阈值判据.
4)定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分辨率上来估计,边缘的方位也可以被估计出来.
5、LOG算法的两种等价算法:
1)求图像与高斯滤波器卷积,再求卷积的拉普拉斯变换.
2)求高斯滤波器的拉普拉斯变换,再求与图像的卷积.
6、canny边缘检测算法步骤:
- 用高斯滤波器平滑图像;
- 用一阶偏导有限差分计算梯度幅值和方向;
- 对梯度幅值应用非极大值抑制 ;
- 用双阈值算法检测和连接边缘.
第六章
1、轮廓:
把边缘连接起来就成为轮廓(contour).
轮廓可以是断开的,也可以是封闭的.
2、轮廓的表示方法:
轮廓可以用边缘有序表或曲线来表示。
曲线通常称为轮廓的数学模型。
曲线表示包括线段、二次曲线、三次样条曲线等.轮廓表示的评价标准:
效率:轮廓应该是一种简单和紧凑的表示.
精确:轮廓应能精确地逼近图像特征.
有效:轮廓应适合于后续应用阶段的计算
3、内插和逼近曲线:
已知一组称为控制点的坐标点,
内插是指一条曲线拟合这组控制点,使得曲线通过所有的控制点;
逼近是指一条曲线拟合这组这组控制点,使得这条曲线非常接近这些控制点而无需一定通过这些点.
4、链码:
链码是沿着轮廓记录边缘表的一种表示方法.
链码规定了边缘表中每一个边缘点的轮廓方向,其中方向被量化为四个或八个方向中的一个.
5、链码、差分链码的表示:
6、样条曲线的两种等效及其异同点:
1)几何等效:指它们连接相同的点集,即它们在空间上对应着相同的形状;
2)参数等效:两条曲线的方程一样.
显然,参数等效性比几何等效性更稳定.两条曲线可以是几何上等效但可以具有不同的参数表示式,这是机器视觉中曲线拟合的一个重要概念.比如,机器视觉系统可以产生基于三次样条曲线的表示,其在几何上非常接近于物体轮廓的真实表示,但在参数意义上,表示可能完全不同.在物体识别应用方面和工业零件图像与其模型匹配应用中,通过比较三次样条曲线的参数形式实现匹配几乎是不可能的,在这种情况下,比较必须基于几何等效性。
7、Hough变换算法:
1)适当地量化参数空间.
2)假定参数空间的每一个单元都是一个累加器
3)把累加器初始化为零
4)对图像空间的每一点,在其所满足的参数方程对应的累加器上加1;
5)累加器阵列的最大值对应模型的参数.
第七章
1、纹理:
按一定规则对元素或基元进行排列所形成的重复模式.
2、灰度级同现矩阵:
灰度级同现矩阵P[i,j]是一个二维相关矩阵,规定一个位移矢d=(dx,dy),计算被d分开且具有灰度级i和j的所有象素对的个数。
第八章
1、辐照度与辐射度:
1)辐射度:单位面积辐射表面在单位时间内向某一方向辐射的能量;
2)辐照度:单位时间到达单位面积表面的辐射能量光源只有辐射,图像平面只有辐照,物体既有辐照,也有辐射.
2、双线反射分布函数:
到达表面的辐照度与辐射度之比
第十章
1、线性颜色空间(RGB模型的线性变换):
RGB, CMY, XYZ, YIQ, YUV
2、非线性颜色空间(RGB模型的非线性变换):
Lab*, Luv*, HSV(HSI)
第十一章
1、深度图:
每一个像素值表示场景中某一点与摄像机之间的距离所形成的图像叫做深度图
2、测距成像系统原理公式及推导:
假设坐标系原点与左透镜中心重合。F是焦距,B是基线距离。
3、基线过长所产生的问题:
随着基线距离的增加,两个摄象机的共同的可视范围减小;
场景点对应的视差值增大,则搜索对应点的范围增大,出现多义性的机会就增大;
由于透视投影引起的变形导致两个摄象机获取的两幅图像不完全相同,这就给确定共轭对带来了困难.
第十二章
1、 识别系统的基本组成:
模型库,特征检测器,假设生成和假设验证
2、 物体的检测和识别的策略:
进行物体识别的第一步是物体特征检测,然后基于检测出来的图像特征,对图像中可能的物体建立假设公式,并使用物体模型来验证假设,并不是所有的物体识别方法都需要很强的假设公式和验证步骤,大部分识别策略已经演化,将假设和验证着两步一不同的比例组合起来
第十四章
1、摄象机和场景运动的四种模式:
1)摄象机静止/物体静止:简单的静态场景分析.
2)摄像机静止/场景运动:一类非常重要的动态场景分析,包括运动目标检测、目标运动特性估计等,主要用于预警、监视、目标跟踪等场合。
3)摄象机运动/物体静止:重要的动态场景分析,包括基于运动的场景分析、理解,三维运动分析等,主要用于视觉导航、目标自动锁定与识别等.
4)摄象机运动/物体运动:最一般的情况,也是最难的问题,目前对该问题研究的还很少.