一、图像增强
对比度增强,直方图均衡化,直方图匹配(规定化),
直方图统计学,直方图修正,平滑,
锐化,同态增晰,几何校正,
伪彩色假彩色,图像间的算术运算。
用算术逻辑操作增强(图像减法处理,图像平均处理)。
平滑空间滤波器(平滑线性滤波,统计排序滤波)。
锐化空间滤波(拉普拉斯算子,梯度法)。
频率域图像增强(理想低通滤波,巴特沃思低通滤波,高斯低通滤波)。同态滤波。
---------------------------------以下为具体内容-------------------
在邻域内实现增强操作常利用模板与图像卷积来实现。模板实际上是一个小的(如3*3)二维阵列,模板中各元素的取值确定了模板的性质,如图像平滑、锐化等。这种模板操作常称为空间滤波。
直接灰度变换:图像求反,线性灰度变换,对数变换(可动态压缩),灰度切割(增强特定范围的对比度),位图切割(多个位表示灰度值,每个像素由8位表示时,就说图像有8个位平面)。
直方图修正:表示数字图像中每一个灰度级与该灰度级出现的频率之间的统计关系。
直方图均衡化(若一幅图像其像素占有全部可能的灰度级并且分布均匀,则这样的图像有高对比度和多变的灰度色调,而显示出一幅灰度级丰富且动态范围大的图像。此方法仅依靠输入图像的直方图的信息可达到这一效果。这个方法的基本思想是把原始图像不均衡的直方图变换为均匀分布的形式,这样就增加了灰度值的动态范围,从而达到增强图像整体对比度的效果。
优点是能自动增强整个图像的对比度,但它的具体增强效果不易控制,处理的结果也是得到全局均衡化的直方图。)
直方图规定化(有时需变换直方图,使之成为某个特定的形状,从而有选择地增强某个灰度值范围内的对比度。
三个步骤:(1)均衡化。(2)同样对规定图像计算能使规定的直方图均衡化的变换。(3)将第一步的变换反转过来,即将原始直方图对应映射到规定的直方图。)
空间滤波增强:在图像空间中借助模板进行邻域操作完成。可分为线性滤波和非线性滤波。平滑滤波和锐化滤波。
平滑滤波器的作用是模糊处理和减少噪声。
线性平滑滤波:用滤波模板确定的邻域内像素的平均灰度值去代替图像中的每一个像素点的值。
中值滤波。
锐化滤波:防止图像模糊。使边缘和轮廓线模糊的图像变得清晰,使其细节更加清晰。梯度算子法,拉普拉斯算子法。
频域滤波增强:
卷积过程:将图像模板在图像中逐像素移动,并对每个像素进行指定数量的计算。
低通滤波:图像中的边缘和噪声对应于傅里叶变换中的高频部分。
巴特沃斯低通滤波:
高通滤波:
带通和带阴滤波:带通滤波器允许某个频率范围内的信号通过,而阻止其他频率范围的信号通过。与此相反,带阻滤波器阻止某个频率范围内的信号通过,而允许其他频率范围的信号通过。
同态滤波:在频域中同时将图像亮度范围进行压缩和将图像对比度增强。
---------------------------------------------------------------------
---------------------------------------------------------------------
---------------------------------------------------------------------
二、图像恢复
降质模型,频域中的恢复方法,约束和无约束的最小二乘估计,
线性或非线性的均方估计,最大熵恢复,图像恢复的代数方法,
运动模糊恢复,盲恢复。
噪声模型。噪声存在下的惟一空间滤波复原(均值滤波,顺序统计滤波,自适应滤波,频域滤波)。
削减周期噪声(带阻滤波,带通滤波,陷波滤波,最佳陷波滤波)。
线性、位置不变的退化,图像观察估计法,试验估计法,模型估计法。
逆滤波。维纳滤波。几何均值滤波。几何变换。
---------------------------以下为图像恢复的具体内容--------------------
图像品质的原因。
图像退化模型是关键。
无约束和有约束两类。自动和交互。频域和空域。
连续函数退化模型:将线性系统理论中的单位冲激信号进行应用。
离散的退化模型:使用离散卷积的矩阵计算。求原始图像的计算量很大,需用循环矩阵对角化。
退化函数的估计:图像复原的主要目的是给定退化图像g(x,y)和退化函数H、噪声的假设,估计出原始图像f(x,y)。
而退化函数 H 需要估计。
估计方法:图像观察估计法;试验估计法;模型估计法。
消除匀速运动模糊。
维纳滤波:逆滤波比较简单,但没有清楚说明如何处理噪声。而维纳滤波综合了退化函数和噪声统计特性两方面进行复原处理。
维纳滤波是寻找一个滤波器,使得复原后图像和原始图像的均方误差最小。维纳滤波器通常又称为最小均方误差滤波器。
维纳滤波,存在的问题:
(1)需要知道未退化图像和噪声的功率谱,但一般不知道。
(2)维纳滤波建立在最小化统计准则的基础上,它所得到的结果只是平均意义上的最优。
约束最小二乘方滤波:其一,只要求噪声方差和均值的知识,而这些参数经常能从一幅给定的退化图像计算出来;其二,约束最小二乘方滤波对于所处理的每一幅图像都能产生最优的结果。
从噪声中复原:起因于图像获取和图像传输过程。通常认为噪声是由概率密度函数PDF表示的随机变量。
通常的噪声:高斯噪声,瑞利噪声,伽马噪声,指数噪声,均匀噪声,脉冲噪声。
空域滤波复原:均值滤波器,顺序统计滤波器,自适应滤波器。
均值滤波器包括:算术均值滤波器,几何均值滤波器,谐波均值滤波器,逆谐波均值滤波器。
顺序统计滤波器:其输出基于由滤波器包围的图像区域中像素点的排序,滤波器在任何点的输出由排序结果决定。有中值滤波器,最大值滤波器,最小值滤波器,中点滤波器。
自适应滤波器:
几何失真校正:从广义上说是一种图像退化。几何失真校正包括如下两个步骤:
空间变换:恢复原空间关系。
灰度插值。对空间变换后的像素赋予相应的灰度值以恢复原位置的灰度值。
几何失真图像配准复原。
---------------------------------------------------------------------
---------------------------------------------------------------------
---------------------------------------------------------------------
三、图像分割
根据灰度分割,边界检测的基本方法,拟合曲面求导法,
高斯平滑滤波求导法,统计判决法,分裂--合并算法,
跟踪技术,模糊数学方法,模型化和统计检验法,
松驰标记法,匹配检测技术,活动轮廓模型法,
基于模式识别检测法,基于视觉特性检测法。
间断检测。边缘连接和边界检测。
门限处理(基本全局门限,基本自适应门限,最佳全局和自适应门限,基于不同变量的门限)。
基于区域的分割(区域生长,区域分离和合并)。
基于形态学分水岭的分割(水坝构造,分水岭分割算法)
---------------------------------以下为具体内容-------------------
图像识别的基础是图像分割,其作用是把反映物体真实情况的、占据不同区域的、具有不同特性的目标区分开来,并形成数字特征。
图像分割是图像识别和图像理解的基本前提步骤,图像分割质量的好坏直接影响后续图像处理的效果,甚至决定其成败。
图像分割是指将一幅图像分解为若干互不交叠的、有意义的、具有相同性质的区域。
好的图像分割具有以下特征:
(1)分割出来的各区域对某种性质(例如灰度、纹理)而言具有相似性,区域内部是连通的且没有过多小孔。
(2)相邻区域对分割所依据的性质有明显的差异。
(3)区域边界是明确的。
边缘是一个区域的开始,是另一个边缘的结束。
基于一阶导数的边缘检测算子包括:ROBERTS算子,SOBEL算子,PREWITT算子。还有拉普拉斯算子,LOG算子,CANNY算子。梯度算子。高斯--拉普拉斯算子。
边界跟踪:获得的边缘点有可能是不连续的,必须通过边界跟踪将它们转换为有意义的边缘信息,以便于后续处理。
边界跟踪三个步骤:(1)确定边界的起始搜索点。(2)确定合适的边界判别准则和搜索准则。(3)确定搜索的终止条件。
霍夫变换:HOUGH变换可以用于将边缘像素连接起来得到边界曲线,它的主要优点在于受噪声和曲线间断的影响较小。
阈值分割:经典方法是基于灰度阈值的分割方法,它通过设置阈值,把像素点按灰度级分若干类,从而实现图像分割。
人工选择法:
自动阈值法:通常使用灰度直方图来分析图像中灰度值的分布,结合特定的应用领域知识来选取最合适的阈值。
最小误差阈值选择法:通常以图像中的灰度为模式特征,假设各模式的灰度是独立同分布的随机变量,并假设图像中待分割的模式服从一定的概率分布,则可以得到满足最小误差分类准则的分割阈值。
分水岭算法:图形看作拓扑地形图。灰度值看做对应地形高度值。
区域分割:认为分割出来的属于同一区域的像素应具有相似的性质,其概念是相当直观的。
传统的区域分割法:区域增长法,区域分开合并法。是一种迭代方法,空间和时间开销比较大。
运动分割:
背景差值法:假定图像背景是静止不变的,将每一帧图像的灰度值减去背景灰度值可得到一个差值图像。
图像差分法:图像背景不是静止。
基于光流的分割方法:
基于块的分割方法:
---------------------------------------------------------------------
---------------------------------------------------------------------
---------------------------------------------------------------------
四、图像表示与描述
链码,多边形近似,
标记图,边界线段,骨架。
边界描绘子:形状数,傅里叶描绘子,统计矩。
区域描绘子:拓扑描绘子,纹理,二维函数矩。
运用主分量进行描绘。关系描绘。)
---------------------------------以下为具体内容-------------------
图像表示可以基于其内部特征,也可以基于外部特征,由此可将图像表示分成边界表示(如链码,边界分段等),和区域表示(如四叉树、骨架)两大类。
通常,边界表示较为关心的是图像中区域的形状特征,而区域表示则倾向于反映区域的灰度、颜色、纹理等特征。
描述方法:边界描述,区域描述。
三维:体积描述,表面描述,广义圆柱体描述。由二维组成。八叉树。广义锥。
下面讨论如何把图像低层处理之后的图像特征转换成有意义的几何表示。
四种边界表示:链码,边界分段,多边形近似和标记图。一种区域表示:骨架。
边界描述:
区域描述:
形态学描述:膨胀和腐蚀,开启和闭合,
---------------------------------------------------------------------
---------------------------------------------------------------------
---------------------------------------------------------------------
五、图像编码
冗余编码、变换编码、小波变换编码、
神经网络编码、模型基编码。离散信源编码定理。
赫夫曼编码,香农--范诺编码,算术编码,行程编码。
LZW算法,预测编码(无损预测编码,有损预测编码),
变换编码,基于矢量量化技术的图像编码。
小波图像编码。
------------------------------以下为具体内容--------------------
以前一篇博客中的问题的答案:
一幅512*512像素,8B/像素的黑白图像,占256KB磁盘空间。
一幅512*512像素,每分量8B/像素的彩色静止图像,占3*256=768KB的磁盘空间。
如果以每秒24帧传送此图像,则一秒钟的数据量=24*768KB=18?5MB.
冗余:空间冗余,时间冗余,结构冗余,信息熵冗余,知识冗余,视觉冗余。
图像的编码质量评价:
可逆编码和不可逆编码。压缩前后的图像严格相同否。
不可逆编码:有失真压缩编码,熵压缩编码,有损压缩编码。
客观评价准则;主观评价准则。
压缩比。
信息理论基础与熵编码:
离散信息源的熵表示。
离散信息源编码定理:(1)香农信息保持编码定理。(2)变长编码定理。(3)变长最佳编码定理。
赫夫曼编码。和《数据结构》课程中内容相近。
香农--范诺编码。基于统计的变长编码算法,与HUFFMAN编码没有本质的区别。
算术编码:
不是将单个信源符号映射成一个码字,而是,将整个信源表示为实数0到1之间的一个区间,其长度等于该序列的概率。再在该区间选择一个代表性的小数,转化为二进制作为实际的编码输出。
消息序列中的每个元素都要缩短为一个区间。消息序列中元素越多,所得到的区间就越小。当区间变小时,就需要更多的位数来表示这个区间。
采用算术编码,每个符号的平均编码长度可以为小数。
行程编码:RUN LENGTH ENCODING,RLE。利用空间冗余度压缩图像的方法,对某些相同灰度级成片连续出现的图像,是一种高效的编码方法。特别对二值图像显著。
主要用在公用电话网上传真二值图像。
LZW算法:LEMPEL-ZIV-WELCH,对信源符号的可变长度序列分配固定长度的码字,且不需要了解被编码信源的概率情况。
基本思想是建立一个编码表(WELCH称之为串表),将输入字符串映射成定长的码字输出,通常码长设为12比特。如果将图像当做一个一维的比特串,编码图像也视为一个一维的比特串,算法在产生输出串的同时更新编码表,这样编码表可以更好地适应所压缩图像的特殊性质。
预测编码:PREDICTIVE CODING。建立在信号数据的相关性上。它根据某一模型,利用以前的样本值对新样本进行预测,以此减少数据在时间和空间上的相关性,从而达到压缩数据的目的;但在实际预测编码时,一般不是建立在数据源的数学模型,而是基于估计理论、现代统计学理论,这是因为数据源的数学模型很难建立,有时根本无法得到其数学模型。
在图像编码中有DPCM(DIFFERENTIAL PULSE CODE MODULATION,差分脉冲编码调制)。
无损预测编码:预测编码的基本思想是通过对每个像素中新增的信息进行提取和编码,以此来消除空间上较为接近的像素之间的冗余。这里新增信息是指像素实际值和预测值之间的差异。
有损预测编码:在前述模型上加一个量化器。(1)德尔塔调制。(2)最优量化器。(3)最佳线性预测器。(4)线性自适应预测编码。
以上讨论的图像编码技术,都是直接对像素空间进行操作,称为空域方法。
变换编码:
图像数据一般具有较强的相关性,若所选用的正交矢量空间的基矢量与图像本身的主要特征相近,在该正交矢量空间中描述图像数据则会变得更简单。图像经过正交变换后,把原来分散在原空间的图像数据在新的坐标空间中得到集中。对于大多数图像,大量变换系数很小,只要删除接近于零的系数,并且对较小的系数进行粗量化,而保留包含图像主要信息的系数,以此进行压缩编码。在重建图像进行解码(逆变换)时,所损失的将是一些不重要的信息,几乎不会引起图像的失真,图像的变换编码就是利用这些来压缩图像的,这种方法可得到较高的压缩比。
变换编码首先将一幅N*N的图像分割成(N/n)^2个子图像,然后对子图像进行变换操作,解除子图像像素间的相关性,达到用少量的变换系数包含尽可能多的图像信息的目的,接下来的量化步骤,是有选择地消除或粗量化带有很少信息的变换系数,因为它们对重建图像的质量影响很小。最后是编码,一般用变长码对量化后系数进行编码。解码是编码的逆操作,由于量化是不可逆的,所以在解码中没有对应的模块,其实压缩并不是在变换步骤中取得的,而是在量化变换系数和编码时取得的。
变换选择:取决于可允许的重建误差和计算复杂性。
基于矢量量化技术的图像编码:
矢量量化(VECTOR QUANTIZATION,VQ)技术是一种有损压缩技术,它根据一定的失真测度在码书中搜索出输入矢量失真最小的码字的索引,传输时仅传输这些码字的索引,接收方根据码字索引在码书中查找对应码字,再现输入矢量。
变换选择:
---------------------------------------------------------------------
---------------------------------------------------------------------
---------------------------------------------------------------------
----------------------以下内容未补充---------------------------
一、二、三、四、五项,可“望文生义”。
一、图像分析
边缘检测、区域分割、特征抽取。
二、图像识别
统计、句法(结构)、模糊识别法。
三、图像变换
傅里叶变换,余弦变换,沃尔什--哈达玛变换,奇异值分解,KL变换,对数变换,幂次变换,分段线性变换。
四、图像分析与描述
灰度幅值与统计特征描述,边界点集组织与曲线描述,闭合曲线的傅氏描述,
区域和曲线角点提取,区域拓扑特性,区域的矩描述,
区域主轴,区域等效椭圆,区域几何特性,
区域四分树方法,区域中轴,区域扩展与收缩,
区域曲线表示,区域纹理特性,图像的关系描述。
五、图像数据压缩
轮廓编码压缩,行程编码压缩,预测误差编码压缩,
正交变换编码压缩,自适应编码压缩,混合编码压缩,
子带编码技术,人工神经网络技术,分形几何理论压缩,小波理论压缩。
编码冗余,像素间冗余,心理视觉冗余,
保真度准则。变长编码,LZW编码,
位平面编码,无损预测编码。
有损预测编码,变换编码,小波编码。图像压缩标准。
六、图像重建
图像投影重建基本原理,离散图像的傅氏变换重建法,卷积逆投影法,
扇形投影的滤波逆投影法,代数重建法。
关于目标的三维形状感知,运动分析,空间定位等理论和方法是机器视觉涉及的主要内容。
七、图像复原、图例合成、
图像存储和传输、图像获取、
目标检测、图像表示与描述、
图像配准、图像分类与识别、
图像理解、场景分析和理解、
图像数据库的建立索引检索以及综合利用
八、图像复原
噪声干扰和模糊。可用逆滤波、维纳滤波、
最小约束二乘方滤波、同态滤波方法去除。
参考文献:
1、《图像处理》,孙即祥,科学出版社,2004年9月第一版
2、《数字图像处理》,姚敏等,机械工业出版社,2006年7月第一版
3、《数字图像处理》(第二版),Rafael C. Gonzalez,,Richard E. Woods,冈萨雷斯,电子工业出版社,2004年6月