《数字图像处理》第三版个人笔记

第一章 绪论

什么是数字图像处理

一幅图可以定义为一个二位函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为图像在该点的强度和灰度。当x,y和幅度值f是有限的离散数值时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。注意,数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅度。这些元素被称为图画元素、图像元素或像素。

图像三种处理:

  1. 低级处理,如降低噪声的图像预处理,对比度增强和图像锐化。低级处理以输入、输出都是图像为特征
  2. 中级处理,涉及诸多任务,如分割,减少这些目标物的描述,使其更适合计算机处理及对不同目标的分类(识别)。中级处理以输入为图像但是输出是从这些图像中提取的特征(如边缘、轮廓及各物体的标识)为特征。
  3. 高级处理,涉及“理解”已识别目标的总体,就像在图像分析中那样,以及在连续统一体的远端执行与视觉相关的认知功能。

数字图像处理领域:

  • 伽马射线成像:用于核医学和天文观测
  • X射线成像:医学、工业和其他领域
  • 紫外波段成像:平板印刷术、工业检测、显微方法、激光、生物成像和天文观测等
  • 可见光及红外波段成像:光显微方法、天文、遥感、工业和法律实施等
  • 微波波段成像:雷达
  • 无线电波段成像:核磁共振成像(MRI)和天文

第二章 数字图像基础

简单的图像形成模型

用f(x,y)的二维函数来表示图像。

					 f(x,y)=i(x,y)r(x,y)

i(x,y):入射分量,入射到被观察场景的光源照射总量
r(x,y):反射分量,场景中物体所反射的光照总量

0 <i(x,y) <无穷
0 <r(x,y) <1 #0全吸收,1全反射

f(x0,y0)表示图像在(x0,y0)处的强度,值在【Lmin,Lmax】之间。区间【Lmin,Lmax】称为灰度级,实际情况中令该区间为【0,L-1】,0为黑色,L-1为白色。

图像的量化和取样

将一幅图片进行数字化,对坐标和幅值进行取样操作,对坐标值进行数字化称为取样,对幅值数字化称为量化。

对于一幅M×N(M和N为正整数)大小的图像,出于存储和量化硬件的考虑,灰度级L通常取为2k。假设离散灰度级是等间距的,且它们是区间【0,L-1】内的整数。上限取决于饱和度(超过这个值的灰度级被剪掉的一个最高值),下限取决于噪声(灰度较暗的区域的噪声区域,掩盖了可检测的最低真实灰度级)

存储数字图像所用的比特数b为:b=M×N×k
当M=N时:b=N²k 。
当一幅图片有2k个灰度级时,实际通常称该图像为一幅“k比特图像”。

1.空间和灰度分辨率

空间分辨率是图像中可辨别的最小细节的度量。在数量上,空间分辨率可以有很多方法来说明,其中单位距离的线对数和单位距离的点数(像素数)是最通用的度量。广泛使用的图像分辨率的定义是单位距离内可分辨的最大线对数量(譬如每毫米100个线对)。单位距离的点数是印刷和出版业中常用的图像分辨率的度量。

灰度分辨率是指在灰度级中可分辨的最小变化。

2.图像内插

内插是在诸如放大、收缩、旋转和几何校正等任务中最广泛应用的基本工具。
图像重取样方法:收缩和放大(本章讨论)

  1. 最近邻内插法(不常用):
    假想一个放大的网格,使其与原图像有相同的间隔,然后将其收缩,使它准确地与原图像匹配。为了对覆盖的每个点赋以灰度值,我们在原图像中寻找最接近的像素,并把该像素的灰度赋给放大网格中的新像素,完成所有点的灰度赋值后,把图像扩展到原来规定的大小。

  2. 双线性内插法(常用):
    用四个最近邻去估计给定位置的灰度。令(x,y)为我们想要赋以灰度值的位置的坐标,并另v(x,y)表示灰度值。

                    v(x,y)=ax+by+cxy+d
    

    4个系数可用由点(x,y)的4个最近邻点写出的未知方程确定。

  3. 双三次内插法,包括16个最近邻点:

    v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i j x i y j v(x,y) = \sum_{i=0}^3\sum_{j=0}^3 a_{ij}x^iy^j v(x,y)=i=03j=03aijxiyj

像素间的基本关系

像素p的4个水平垂直相邻像素:(x+1,y) (x-1,y) (x,y+1) (x,y-1) 称为p的4邻域,用 N 4 ( p ) N_4(p) N4(p)表示
p的4个对角相邻像素的坐标为:(x+1,y+1) (x+1,y-1) (x-1,y+1) (x-1,y-1),用 N D ( p ) N_D(p) ND(p)表示。
这8个点称为p的8邻域。

数学图像处理中所用数学工具介绍

线性操作和非线性操作

图像处理方法最重要的分类依据之一是,它是非线性还是非线性的。
求最大值的操作是非线性的:{max像素矩阵a}+{像素矩阵b} not equal max{a+b}

算术操作

两个图片进行加减乘除,是对每个像素进行操作。

  • 针对降噪的待噪图像相加
    另g(x,y)是无噪声图像f(x,y)被加性噪声n(x,y)污染后的图像,即

     	g(x,y)=f(x,y)+n(x,y)
    

    g ‾ ( x , y ) \overline{g}(x,y) g(x,y)= 1 K ∑ i = 1 K g i ( x , y ) \frac{1} {K}\sum_{i=1}^Kg_i(x,y) K1i=1Kgi(x,y)
    随着带噪图像的数量增加,E( g ‾ ( x , y ) \overline{g}(x,y) g(x,y))逼近f(x,y)

  • 增强差别的图像相减

      g(x,y)=f(x,y)-h(x,y)
    
  • 使用图像相乘和相除来校正阴影
    假设一个成像传感器产生可由f(x,y)表示的完美图像与阴影函数h(x,y)的乘积来建模的图像,即

     		g(x,y) = f(x,y)h(x,y)
    

    如果h(x,y)已知,那么我们可以使用h(x,y)的反函数乘以感知图像得到f(x,y)。h(x,y)未知,但图像系统可以访问,我们可以通过对具有恒定灰度的目标成像得到一个近似的阴影函数。
    图像相乘的另一种普通应用是模板操作,也称为感兴趣区域(ROI)操作。

大多数图像用8比特显示(即使24比特的彩色图像也是由分立的三个8比特通道组成的)。这样,我们认为图像的灰度值范围为0~255。两幅8比特图像的不同取值范围可以是从最小的-255到最大的255,图像之和取值可能范围在0到510之间,给定一幅图像f,保证图像间算术操作的整个值域落入某个固定比特数的方法如下:

f m = f − m i n ( f ) f_m=f-min(f) fm=fmin(f) #该操作生成最小值为0的一幅图像
f s = K [ f m / m a x ( f m ) f_s = K[f_m/max(f_m) fs=K[fm/max(fm) #生成一幅标定的图像 f s f_s fs,值在[0,K]之间
这种方法可以用于所有的算术操作。
执行除法操作时要求讲一个较小的数加到图像的像素上,以避免除以0的情况。

空间操作

几何空间变换:

		(x,y)=T{(v,w)} #(v,w)是原图像中像素的坐标,(x,y)是变换后图像像素的坐标。

最常用的空间坐标变换之一是仿射变换:

							[x y 1]=[v w 1]T

做变换时可考虑最近邻、双线性和双三次内插技术。

  • 恒等变换
    T= 1 0 0 0 1 0 0 0 1 \begin{matrix} 1 &amp; 0 &amp; 0 \\ 0 &amp; 1 &amp; 0 \\ 0 &amp; 0 &amp; 1 \\ \end{matrix} 100010001
    坐标公式 x=v,y=w
  • 尺度变化
    T= c x 0 0 0 c y 0 0 0 1 \begin{matrix} c_x &amp; 0 &amp; 0 \\ 0 &amp; c_y &amp; 0 \\ 0 &amp; 0 &amp; 1 \\ \end{matrix} cx000cy0001
    坐标公式 x= c x c_x cxv,y= c y c_y cyw
  • 旋转变换
    T= c o s Θ s i n Θ 0 − s i n Θ c o s Θ 0 0 0 1 \begin{matrix} cos\Theta &amp; sin\Theta &amp; 0 \\ -sin\Theta &amp; cos\Theta &amp; 0 \\ 0 &amp; 0 &amp; 1 \\ \end{matrix} cosΘsinΘ0sinΘcosΘ0001
    坐标公式 x=vcos Θ \Theta Θ- wsin Θ \Theta Θ,y=vsin Θ \Theta Θ+wcos Θ \Theta Θ
  • 平移变换
    T=
    1 0 0 0 1 0 t x t y 1 \begin{matrix} 1 &amp; 0 &amp; 0 \\ 0 &amp; 1 &amp; 0 \\ t_x &amp; t_y &amp; 1 \\ \end{matrix} 10tx01ty001
    坐标公式 x=v+ t x t_x tx,y=w+ t y t_y ty
  • (垂直)偏移转换 1 0 0 s v 1 0 0 0 1 \begin{matrix} 1 &amp; 0 &amp; 0 \\ s_v &amp; 1 &amp; 0 \\ 0 &amp; 0 &amp; 1 \\ \end{matrix} 1sv0010001
    坐标公式 x=v s v s_v sv+w,y=w
  • (水平)偏移转换 1 s h 0 0 1 0 0 0 1 \begin{matrix} 1 &amp; s_h &amp; 0 \\ 0 &amp; 1 &amp; 0 \\ 0 &amp; 0 &amp; 1 \\ \end{matrix} 100sh10001
    坐标公式 x=v,y= s h s_h shv+w

图像标配:用于对其两幅或多幅相同场景的图像,对图像几个畸形进行修正

找约束点,这些点是在输入图像和参考图像中其位置恰好已知的相应点。
假设在输入图像和参考图像中有一组4个的约束点:

			x=c1v+c2w+c3vw+c4
			y=c5v+c6w+c7vw+c8

(v,w)和(x,y)分别为输入图像和参考图像中约束点的坐标,带入4个点求得c1c2…c8
变换模型就建立好了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值