数字图像处理(第三版,Rafeal C. Gonzalez, Richard E. Woods)--基础

图像处理图像分析计算机视觉
低级中级高级
降噪
对比度增强
锐化
分割,边缘,标志等人工智能
视觉认知
图像 = f(图像)特征 = f(图像)认知 = f(特征)

在这里插入图片描述
人的直觉和分析在选择技工具术时起到核心作用,这种选择通常基于主观的视觉判断!
在这里插入图片描述
在这里插入图片描述
亮度适应与辨别
在这里插入图片描述
人眼的 主 观 ( 感 知 ) 亮 度 = l o g 入 眼 光 强 主观(感知)亮度 = log{入眼光强} ()=log
[ l o g 0.001 , l o g 0.1 ] 即 [ − 3 , − 1 ] m L [log{0.001},log{0.1}] 即 [-3,-1] mL [log0.001,log0.1][3,1]mL 为暗视觉到亮视觉过渡区
视觉系统能够适应106的光强度级,原因在于动态调整灵敏度,即亮度适应
同时辨别强度范围只占适应范围很小一部分
当前灵敏度级别称为亮度适应级别(会随着“背景”强度变化而变化)

人眼辨别能力的实验:A区域(相对漫反射区很小)使用增强光闪烁照射,人眼评判能否被识别
在这里插入图片描述
韦伯比 = Δ I C I = Δ I × % 50 I \frac{\Delta I_C}{I}=\frac{\Delta I\times \%50}{I} IΔIC=IΔI×%50 其中 Δ I \Delta I ΔI为测试对象100%能够区分区域A时的值
在这里插入图片描述
眼睛在扫视时背景的平均值在变化,适应级发生变化,人眼能够辨别更宽的范围

相关效应 :马赫带
在这里插入图片描述
相关效应 :同时对比
在这里插入图片描述
没有颜色的光称为单色光(monochromatic or achromatic light)
单色光唯一的属性是他的强度(intensity),使用 灰度级(gray level) 表示,即
取值区间内可取灰度值的个数,出于存储和量化硬件考虑,灰度级数典型取2k
电磁波并不是成像的唯一方法,声波、电子束都可以。

单色值 f ( x , y ) = i ( x , y ) r ( x , y ) f(x,y)=i(x,y)r(x,y) f(x,y)=i(x,y)r(x,y) i ( x , y ) i(x,y) i(x,y)为场景入射分量 ( 0 , ∞ ) (0,\infty) (0,) r ( x , y ) r(x,y) r(x,y)为场景反射分量 ( 0 , 1 ) (0,1) (0,1)
L m i n = i m i n r m i n ≤ f ( x , y ) ≤ L m a x = i m a x r m a x L_{min} = i_{min}r_{min}\leq f(x,y)\leq L_{max}=i_{max}r_{max} Lmin=iminrminf(x,y)Lmax=imaxrmax
[ L m i n , L m a x ] [L_{min},L_{max}] [Lmin,Lmax]称为 灰度级
通常使用 [ 0 , L − 1 ] [0,L-1] [0,L1]表示[黑色,白色]

图像取样和量化
取样=坐标离散
量化=幅值离散
在这里插入图片描述
图 像 系 统 动 态 范 围 = 最 大 可 测 强 度 ( m a x i m u m    m e a s u r a b l e    i n t e n s i t y ) 最 小 可 检 强 度 ( m i n i m u m    d e t e c t a b l e    i n t e n s i t y ) 图像系统动态范围=\frac{最大可测\red{强度}(maximum\;measurable\;intensity)}{最小可检\red{强度}(minimum\;detectable\;intensity)} =(minimumdetectableintensity)(maximummeasurableintensity)上限取决于饱和度,下限取决于噪声
在这里插入图片描述

空间分辨率:每单位距离线对数(显示器是黑白线交错排列)和每单位距离点数(像素数,dpi)
灰度分辨率:灰度级中可分辨的最小变化,使用量化的位数bit描述

内插:使用已知数据估计未知位置的数值(一种重取样)

方法原理特点
最近邻内插最近邻灰度赋予临近像素直线边缘的严重失真
双线性内插 v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
相邻4个点得到4个方程
xy=>本质非线性的
计算量增加 低通滤波
双三次内插 v ( x , y ) = ∑ 0 3 ∑ 0 3 a i j x i y j v(x,y)=\sum_0^3\sum_0^3 a_{ij}x^iy^j v(x,y)=0303aijxiyj
相邻16个点得到16个方程
将距离带入 s i n ( x ) x \frac{sin(x)}{x} xsin(x)的三次插值函数得到权值
效果更好 计算量更大

在这里插入图片描述
矩形上下两块三角形面积相等,则有两个黄色矩形面积相等,y则满足面积关系
y = ( a + b ) y 1 − a y 1 + a y 2 a + b = b y 1 + a y 2 a + b y=\frac{(a+b)y_1-ay_1+ay_2}{a+b}=\frac{by_1+ay_2}{a+b} y=a+b(a+b)y1ay1+ay2=a+bby1+ay2
可以得到
y = x 2 − x x 2 − x 1 y 1 + x − x 1 x 2 − x 1 y 2 y=\frac{x_2-x}{x_2-x_1}y_1+\frac{x-x_1}{x_2-x_1}y_2 y=x2x1x2xy1+x2x1xx1y2
以上方法对 Q 11 , Q 21 Q_{11},Q_{21} Q11,Q21 Q 12 , Q 22 Q_{12},Q_{22} Q12,Q22分别线性插值得到 R 1 R_1 R1 R 2 R_2 R2
再对 R 1 R_1 R1 R 2 R_2 R2进行线性插值得到 f ( x , y ) f(x,y) f(x,y)

∂ 2 f ∂ x ∂ y \frac{\partial ^2f}{\partial x\partial y} xy2f的关系 待探讨!!!!!!!

像素间的基本关系
与P点上、下、左、右 直接相邻P的4邻域 N 4 ( P ) N_4(P) N4(P)对角相邻 N D ( P ) N_D(P) ND(P),总称 P的8邻域 N 8 ( P ) = N 4 ( P ) + N D ( P ) N_8(P) =N_4(P)+N_D(P) N8(P)=N4(P)+ND(P)
V为定义邻接性的灰度值集合,可能是任何 [ 0 , L − 1 ] [0,L-1] [0,L1]的子集
(1) q ∈ N 4 ( p ) , f ( q ) 与 f ( p ) ∈ V q\in N_4(p),f(q)与f(p)\in V qN4(p)f(q)f(p)V,则 p 与 q p与q pq是4邻接的
(2) q ∈ N 8 ( p ) , f ( q ) 与 f ( p ) ∈ V q\in N_8(p),f(q)与f(p)\in V qN8(p)f(q)f(p)V,则 p 与 q p与q pq是8邻接的
(3) p与q混合邻接(m邻接) 避免多重8邻接的二义性(如下图所示)
{ q ∈ N 4 ( p ) q ∈ N D ( p ) 且 f ( N 4 ( q ) ) ∩ f ( N 4 ( p ) ) ∉ V 且 f ( q ) 与 f ( p ) ∈ V \begin{cases} q\in N_4(p) &\\ q\in N_D(p)且f(N_4(q))\cap f(N_4(p))\notin V且f(q)与f(p)\in V & \end{cases} {qN4(p)qND(p)f(N4(q))f(N4(p))/Vf(q)f(p)V
在这里插入图片描述
( x 0 , y 0 ) (x_0,y_0) (x0,y0) ( x n , y n ) (x_n,y_n) (xn,yn)号,前后两点邻接成通路,长n
( x 0 , y 0 ) (x_0,y_0) (x0,y0)= ( x n , y n ) (x_n,y_n) (xn,yn)时称为闭合通路
图像子集S{…},任意P ∈ S \in S S,连通到P的一个像素集称为S的一个连通分量
S只有一个连通分量,S称为连通集(区域)
图像前景 R u = ∑ R K R_u={\sum R_K} Ru=RK,图像背景= ( R u ) c (R_u)^c (Ru)c=前景的补集
P ∈ R u P\in R_u PRu N 8 ( P ) N_8(P) N8(P)中至少一个背景点,P称为内边界(内边缘,内轮廓)
为保证边界是闭合通路,通常运用外边界(背景的内边界)
图像的边界={第0行,第N-1行,第0列,第N-1列}
注意连通的类型(4连通、8连通),区分“边缘”(导数在阈值之外的点)和“边界”
距 离 仅 与 坐 标 有 关 ( 与 连 通 无 关 ) { 欧 拉 距 离 D e = [ ( P ⃗ 1 − P ⃗ 2 ) T ( P ⃗ 1 − P ⃗ 2 ) ] 1 2 城 市 中 心 距 离 D 4 = ∣ x 1 − x 2 ∣ + ∣ y 1 − y 2 ∣ 棱 形 棋 盘 距 离 D 8 = m a x ( ∣ x 1 − x 2 ∣ , ∣ y 1 − y 2 ∣ ) 正 方 形 距离仅与坐标有关(\color{red}与连通无关\color{black}) \begin{cases} 欧拉距离D_e=[(\vec P_1 - \vec P_2)^T(\vec P_1 - \vec P_2)]^\frac{1}{2}\\ 城市中心距离D_4=|x_1-x_2|+|y_1-y_2| 棱形& \\ 棋盘距离D_8=max(|x_1-x_2|,|y_1-y_2|) 正方形& \end{cases} ()De=[(P 1P 2)T(P 1P 2)]21D4=x1x2+y1y2D8=max(x1x2y1y2)
D m D_m Dm距离=点间最短通路长度
数学工具

工具定义
线性操作H H ( a f 1 + b f 2 ) = a H ( f 1 ) + b H ( f 2 ) = a g 1 + b g 2 H(af_1+bf_2)=aH(f_1)+bH(f_2)=ag_1+bg_2 H(af1+bf2)=aH(f1)+bH(f2)=ag1+bg2
像素操作类似 . ∗ 或 . / 或 ± .* 或 ./或 \pm{}{} ../±像素间的操作

eg:带噪相加降噪
污染图= g ( x , y ) = f ( x , y ) + η ( x , y ) g(x,y)=f(x,y)+\eta(x,y) g(x,y)=f(x,y)+η(x,y)=原图+随机噪声(待证明)
g ‾ ( x , y ) = ∑ k = 1 K g k ( x , y ) K = f ( x , y ) + ∑ k = 1 K η ( x , y ) K E { g ‾ ( x , y ) } = f ( x , y ) σ g ‾ ( x , y ) = 1 K σ η ( x , y ) \overline g(x,y)=\frac{\sum_{k=1}^{K} g_k(x,y)}{K} =f(x,y)+\frac{\sum_{k=1}^{K} \eta(x,y)}{K}\\ E\{\overline g(x,y)\}=f(x,y)\\ \sigma_{\overline g(x,y)}=\frac{1}{\sqrt K}\sigma_{\eta(x,y)} g(x,y)=Kk=1Kgk(x,y)=f(x,y)+Kk=1Kη(x,y)E{g(x,y)}=f(x,y)σg(x,y)=K 1ση(x,y)

eg:相减图像增强 g ( x , y ) = f ( x , y ) − h ( x , y ) g(x,y)=f(x,y)-h(x,y) g(x,y)=f(x,y)h(x,y) h ( x , y ) h(x,y) h(x,y)为对象模板,获取细节,图像分割
eg:相乘相除 g ( x , y ) = f ( x , y ) h ( x , y ) g(x,y)=f(x,y)h(x,y) g(x,y)=f(x,y)h(x,y)
校正阴影,其中 h ( x , y ) h(x,y) h(x,y)可以通过取样阴影得到近似
模板操作,感兴趣区域(ROI), 如“遮蔽”
在这里插入图片描述
图像的归一化: f s = K f − f m i n m a x ( f − f m i n ) f_s=K\frac{f-f_{min}}{max(f-f_{min})} fs=Kmax(ffmin)ffmin
图像灰度补集: A c = A n = { ( x , y , 2 k − z ) ∣ ( x , y , z ) ∈ A } A^c=A_n=\{(x,y,2^k-z)|(x,y,z)\in A\} Ac=An={(x,y,2kz)(x,y,z)A}
图像灰度并集: A ∪ B = { max ⁡ z ( a , b ) ∣ a ∈ A , b ∈ B } A\cup B=\{\max\limits_{z}(a,b)|a\in A,b\in B\} AB={zmax(a,b)aAbB}
几何空间变换
几何变换=坐标空间变换+灰度内插
常见空间坐标变换—仿射变换(affine transformation):尺度(缩放),平移,旋转,偏移
[ x    y    1 ] = [ v    w    1 ] [ t 11 t 12 0 t 21 t 22 0 t 31 t 32 1 ] [x\;y\;1]=[v\;w\;1] \begin{bmatrix} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 1 \\ \end{bmatrix} [xy1]=[vw1]t11t21t31t12t22t32001
旋转证明
在这里插入图片描述
前向映射:由 T ( v , w ) T(v,w) T(vw)计算 f ( x , y ) f(x,y) f(xy),可能多值合并,可能越界
反向映射:由 T − 1 T^{-1} T1(x,y)计算(v,w),取最近的点作为输入,效率更高
eg:图像配准
对两幅或多幅相同场景的图像因时间,视角,距离,方向,分辨率,位移和其他因素产生的几何畸变进行修正,主要方法有约束(控制)点矫正
根据输入图像和参考图像建立估计变换函数进行建模,之后进行内插
4 × { x = c 1 v + c 2 w + c 3 v w + c 4 y = c 5 v + c 6 w + c 7 v w + c 8 4\times\begin{cases} x=c_1v+c_2w+c_3vw+c_4 &\\ y=c_5v+c_6w+c_7vw+c_8 & \end{cases} 4×{x=c1v+c2w+c3vw+c4y=c5v+c6w+c7vw+c8
4对约束点坐标解得8个系数,效果不理想时可以进行区域划分,分区域建模,也可用高阶模型
图像变换
工作域{像素空间} ⇒ 变换核 ⇒ 变换域 ⇒ 反变换核 ⇒ 工作域 T ( u , v ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 f ( x , y ) r ( x , y , u , v ) f ( x , y ) = ∑ x = 0 M − 1 ∑ y = 0 N − 1 T ( x , y ) s ( x , y , u , v ) T(u,v)=\sum\limits_{x=0}^{M-1}\sum\limits_{y=0}^{N-1}f(x,y)r(x,y,u,v)\\ f(x,y)=\sum\limits_{x=0}^{M-1}\sum\limits_{y=0}^{N-1}T(x,y)s(x,y,u,v) T(u,v)=x=0M1y=0N1f(x,y)r(x,y,u,v)f(x,y)=x=0M1y=0N1T(x,y)s(x,y,u,v) 如果 r ( x , y , u , v ) = r 1 ( x , u ) r 2 ( y , v ) r(x,y,u,v)=r_1(x,u)r_2(y,v) r(x,y,u,v)=r1(x,u)r2(y,v)称变换核(两个维度上)可分(独立)
如果 r 1 ( x , u ) = r 2 ( y , v ) r_1(x,u)=r_2(y,v) r1(x,u)=r2(y,v)称变换核(两个维度上的变化)对称
傅里叶变换 r ( x , y , u , v ) = e − j 2 π ( u x M + v y N ) s ( x , y , u , v ) = 1 M N e j 2 π ( u x M + v y N ) r(x,y,u,v)=e^{-j2\pi(\frac{ux}{M}+\frac{vy}{N})}\\ s(x,y,u,v)=\frac{1}{MN}e^{j2\pi(\frac{ux}{M}+\frac{vy}{N})} r(x,y,u,v)=ej2π(Mux+Nvy)s(x,y,u,v)=MN1ej2π(Mux+Nvy)
可分对称的傅里叶变换的矩阵形式: T = A F A F = B T B = B A T A B B = A − 1 T=AFA\\F=BTB=BATAB\\B=A^{-1} T=AFAF=BTB=BATABB=A1
概率论方法
某灰度值的概率 p ( z k ) = n k M N p(z_k)=\frac{n_k}{MN} p(zk)=MNnk
概率满足 ∑ k = 0 L − 1 p ( z k ) = 1 \sum\limits_{k=0}^{L-1}p(z_k)=1 k=0L1p(zk)=1
平均灰度 m = ∑ k = 0 L − 1 z k p ( z k ) m=\sum\limits_{k=0}^{L-1}z_kp(z_k) m=k=0L1zkp(zk)
灰度方差(平均值展开度量=对比度测度) μ 2 ( z ) = ∑ k = 0 L − 1 ( z k − m ) 2 p ( z k ) \mu_2(z)=\sum^{L-1}\limits_{k=0}(z_k-m)^2p(z_k) μ2(z)=k=0L1(zkm)2p(zk)
图像(序列) = 空间随机事件( + 时间随机时间)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值