数字图像处理第九章形态学图像处理-CSDN博客

本文链接：https://blog.csdn.net/weixin_44063529/article/details/140881810

在这里插入图片描述

文章目录

引言
一、预备知识 P402 - P404
二、腐蚀与膨胀 P404 - P427
三、开操作与闭操作 P407 - P411
四、击中或击不中变换 P411 - P412
五、一些基本的形态学算法 P412 - P427
六、灰度级形态学 P428 - P437
本章总结

引言

用数学形态学（也称图像代数）表示以形态为基础对图像进行分析的数学工具
基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析识别的目的。即将数字形态学作为工具从图像中提取表达和描绘区域形状的有用图像分量

一、预备知识 P402 - P404

1.1 回顾 2.4.2 数字图像表示 P31 - P32

令 Z 和 R 分别表示整数集和实数集。可将图像的平面（即xy平面）分为网格，网格中每个单元的中心位置是笛卡尔积 $Z^2$ 中的一对元素， $Z^2$ 是所有有序元素对 $z_i,z_j)$ 的集合， $z_i$ 和 $z_j$ 是 Z 中的整数。在数字图像中，令$ x \in Z, y \in Z $ ，(x,y)表示图像中的某一坐标位置， $\in Z^2$ 。
类似的使用 $Z^3$ 表示所有有序元素 $z_i,z_j,z_k)$ 的集合， $z_i$ 、 $z_j$ 和 $z_k$ 是 Z 中的整数。在数字图像中，令 $\in Z，y \in Z，f(x,y) \in Z$ ，(x,y)表示图像中的某一坐标位置，f(x,y) 表示该位置上的灰度值， $\in Z^3$ 。
可以类似的定义 $R^2$ 、 $R^3$

1.2 回顾 2.6.4 集合和逻辑操作 P46 - P49

基本集合操作
a) 令 A 为一个实数序对组成的集合( $R^2$ )
① $\in A$
表示 $a = (a_1,a_2)$ 是 A 的一个元素

② $\notin A$
表示 $a = (a_1,a_2)$ 不是 A 的一个元素，不包含任何元素的集合称为空集，用符号 $\varnothing$ 表示

③ 集合由两个大括号中的内容表示，即 {.}。
eg. 对于 $\{w| w = -d,d \in D\}$ ，所表达的意思是：集合C是元素 w 的集合，而 w 是通过用 -1 与集合D中的所以元素相乘得到的

④ $\subseteq B$
表示集合A中的所有元素又是另一个集合B中的一个元素，称 A 为 B 的子集

⑤ $\cup B$
表示两个集合 A 和 B 的并集

⑥ $\cap B$
表示两个集合 A 和 B 的交集，如果 A 和 B 两个集合没有共同的元素，则称这两个集合是不相容的或互斥的，此时 $\cap B = \varnothing$

⑦ 全集 U 是给定应用中所有元素的集合
eg. 处理实数集合，则集合的全集是实数域

⑧ $A^c = \{w|w \notin A\}$
表示集合 A 的补集，即不包含A的所有其他元素(在全域U中的其他元素)的集合

⑨ $\{w| w \in A，w \notin B\} = A \cap B^c$
表示集合 A 和 B 的差，结果仍是一个集合，并且该集合的元素属于A 而不属于B。或描述为所有属于集合A 但不属于集合B 的元素集合

b) 上述所有的集合操作均在 $R^2$ 中讨论，其中的定义可应用到不考虑灰度值或考虑各像素点灰度值相等(如：二值图像中的白或黑像素)的数字图像对应的 $Z^2$ 中，但是对于灰度数字图像的 $Z^3$ 集合是不适用的，对于图像灰度的集合操作如下：
令灰度级图像的元素用集合 A 来表示，这些元素的三元组形式(x,y,z) ,其中 x 和 y 是空间坐标，z是灰度
① $A^c = \{(x,y,K - z) | (x,y,z) \in A\}$
表示 A 的补集，它简单的表明像素集合A的灰度已从常数K中减去(相当于做图像的灰度反转)。该常数等于 $2^k - 1$ ，其中 k 是用于表示 z 的灰度值的比特数。
② $\cup B = \{ max_z(a,b) | a \in A,b \in B \}$
表示两个灰度集合 A 和 B 的并集，其表明了：两个灰度集合(图像)的并集是一个由空间相应元素对间的最大灰度形成的阵列
③ $\cap B = \{ min_z(a,b) | a \in A,b \in B \}$
表示两个灰度集合 A 和 B 的交集，其表明了：两个灰度集合(图像)的并集是一个由空间相应元素对间的最小灰度形成的阵列

逻辑操作
① 对于二值图像，图像中白色部分像素值为 1，图像中黑色部分像素值为 0
② 在处理二值图像时，即执行 OR、AND、NOT逻辑操作(也就是普通的并、交、求补操作)，就是对图像的像素值(1或0)进行相应的逻辑操作

1.3 数学形态学 P402 - P404

数学形态学的语言是集合论(即以集合的形式讨论数学问题)
数学形态学的集合表示图像中的对象
eg. 二值图像中的白色像素集合表示图像中的对象
二值图像中，所讨论的集合是二维整数空间 $z^2$ 的成员，在该空间中，集合的每个元素都是一个多元组(二维向量) ，这些多元组的坐标(二维向量值) 是图像中的一个白色(或黑色，取决于事先的约定，即约定哪种颜色的像素能表示为图像的对象)像素的坐标
灰度数字图像可以表示为其分量在 $z^3$ 中的集合。在这种情况下，集合中每个元素的两个分量提供一个像素的坐标，第三个分量则对应其离散灰度值
总结：
① 二值图像的集合包含用于描述其图像对象的所有像素点坐标(二维向量)元素
② 灰度图像的集合包含用于描述其图像对象的所有像素点坐标与像素值(灰度值) 元素
集合的反射和平移
① $\hat B = \{w | w = -b，b \in B\}$
表示集合 B 的反射，如果 B 是描述图像中物体的像素的集合(二维点)，则 $\hat B$ 是 B 中(x,y)坐标被(-x,-y)替代的点的集合
② $b)_z = \{c | c = b + z，b\ in B\}$
表示集合B按照点 $z = (z_1,z_2)$ 的平移，若 B 是描述图像中物体的像素集合，则 $B)_z$ 是 B 中(x,y)坐标被 $x + z_1,y + z_2)$ 替代的点的集合
结构元(SE)
① 结构元(SE)：用于研究一幅图像中感兴趣特性所用的小集合或子图像

在这里插入图片描述

上图第一行显示了一些结构元的例子，其中每个涂阴影的方块表示SE的一个成员
② 结构元必须指定原点 (原点一般被放在结构元的重心位置，如上图第一行各结构体中的黑点)
③ 对图像操作时，我们要求结构元是矩形阵列。这是通过添加最小适合数量的背景元素形成一个矩阵阵列来实现

④ 当无所谓给定结构元中的一个位置是否是该SE集合的成员时，该位置用 "X" 来标记

形态学中使用结构元
对于简单的集合 A 与结构元 B
① 在处理前，对集合 A 与结构元 B 均添加最小适合数量的背景元素形成一个矩阵阵列来实现
② 使用结构元 B 在集合 A 上滑动，并在新的集合中生成元素(类似于空间滤波的卷积操作，结构元相当于掩模)，当结构元原点位于原始集合(即未填充背景元素的集合 A)的边界上时，背景边界要大到足以容纳整个结构元。这里也是填充背景元素个数的考虑因素之一（类似于空间滤波在边界处滑动时使用的零填充）

③ 考虑使用结构元B 在集合A 上滑过时生成新的集合点的其中一种操作(腐蚀)：
注意：与空间滤波一样，使用结构元的中点与集合A中各元素重合，每重合一次生成与原集合对应的元素值
a) 若 B 完全被 A 包含（只关注二者的阴影部分的包含情况），则将该位置标记为新集合的一个成员(即标注为阴影)
b) 若 B 没有完全被 A 包含（只关注二者的阴影部分的包含情况），则将该位置标记为非新集合的一个成员(即标注为非阴影)
c) 最终集合 A 的边界被腐蚀

二、腐蚀与膨胀 P404 - P427

2.1 腐蚀 P404 - P406

作为二维整数空间 $Z^2$ 的集合 A 和 B ，表示为 $\Theta B$ 的 B 对 A 的腐蚀定义为
$\Theta B = \{z | (B)_z \subseteq A\}$
(当集合B为结构元时，此处是上述结构元在集合中滑动操作的数学公式。其结果为符合包含关系时，结构元原点所移动的轨迹的集合)
等价于
$\Theta B = \{z | (B)_z \cap A^c = \varnothing \}$

在这里插入图片描述

2.2 膨胀 P406 - P407

A 和 B 是 $Z^2$ 中的集合，表示为 $\oplus B$ 的 B 对 A 的膨胀定义为
$\oplus B = \{ z | (\hat B)_z \cap A \neq \varnothing \}$
当集合B为结构元时，此处是对于：[ 结构元在集合上滑动时，若结构元与原始集合相交(指阴影部分相交)，则将结构体中心点标记为新集合的一个成员] 这一处理方式的数学公式。其结果为符合相交关系时，结构元原点所移动的轨迹的集合
等价于
$\oplus B = \{ z | [(\hat B)_z \cap A] \subseteq A \}$

2.3 对偶性 P407

膨化和腐蚀彼此关于集合求补运算和反射运算是对偶的，即：
$\Theta B)^c = A^c \oplus \hat B$
和
$\oplus B)^c = A^c \Theta \hat B$
或表示为：
$\Theta B = (A^c \oplus \hat B)^c$
和
$\oplus B = (A^c \Theta \hat B)^c$

总结

膨胀会扩大一幅图像的组成部分
腐蚀会缩小一幅图像的组成部分

三、开操作与闭操作 P407 - P411

开操作一般会平滑物体的轮廓、断开较窄的狭颈并消除较细的突出物
闭操作同样也会平滑轮廓的一部分，但与开操作相反，它通常会弥合较窄的尖端和细长的沟壑，消除较小的孔洞，填补轮廓线中的断裂
开操作
① 使用结构元B对集合A进行开操作，定义为
$\circ B = (A \Theta B) \oplus B$
即先用 a) 结构元B 对集合A 腐蚀，再用 b) 结构元B 对前一腐蚀结果进行膨胀

② 与①中等价的数学表达式：
$\circ B = \cup \{ (B)_z | (B)_z \subseteq A\ \}$
其几何解释如下：

假设结构元B 视为一个(扁平的) “转球” 。然后 $\circ B$ 的边界由 B 中的点建立：当 B 在 A的边界内侧滚动时，B 所能到达的 A 的边界的最远点
也就是说，平移结构元B，使集合A 与结构元B存在包含关系(阴影部分相包含)， $\circ B$ 等于：所有结构体B内点的轨迹的集合

闭操作
① 使用结构元B对集合A进行闭操作，定义为
$\cdot B = (A \oplus B) \Theta B$
即先用 a) 结构元B 对集合A 膨胀，再用 b) 结构元B 对前一膨胀结果进行腐蚀

② 闭操作对应的几何解释如下：

结构元B 在集合A 的边界外侧滚动。当且仅当包含 w 的 $B)_z$ 进行的任何平移都有 $(B)_z \cap A \neq \varnothing$ 时，点 w 才是 $\cdot B$ 的一个元素

形态学的开操作与闭操作
开操作与闭操作的对比
开操作和闭操作彼此关于集合求补和反射也是对偶的，即：
$\cdot B)^c = (A^c \circ \hat B)$
和
$\circ B)^c = (A^c \cdot \hat B)$

开操作	闭操作
$\circ B$ 是A的子集合	A 是 $ A \cdot B$ 的子集
如果C是D的子集，则 $\circ B$ 是 $\circ B$ 的子集	如果C是D的子集，则 $\cdot B$ 是 $\cdot B$ 的子集
$\circ B) \circ B = A \circ B$	$\cdot B) \cdot B = A \cdot B$

四、击中或击不中变换 P411 - P412

形态学的击中与击不中变换是形态检测的基本工具
例子讲解击中或击不中变换(目的是定位集合A中的D的位置)
令 B 表示由 D及其背景(W - D)组成的集合，则 B在A中的匹配(或匹配集合)，表示为
令 $B = (B_1,B_2)$ ， $B_1$ 是由与一个目标相联系的 B 的元素构成的集合， $B_2$ 是由与相应背景相联系的 B 的元素构成的集合。即： $B_1 = D，B_2 = (W - D)$

在这里插入图片描述

或

在这里插入图片描述

上述三个公式称为形态学击中或击不中变换

更形象的解释形态学中的击中与击不中变换
① 简单来说击中-击不中运算常用于二值图像，它用于基于结构元素的配置，从图像中寻找具有某种像素排列特征的目标，如单个像素、颗粒中交叉或纵向的特征、直角边缘或其他用户自定义的特征等。
② 击中击不中变换是比图像腐蚀要求更加苛刻的一种形态学操作，图像腐蚀只需要图像能够将结构元素中所有非0元素包含即可，但是击中击不中变换要求原图像中需要存在与结构元素一模一样的结构，即结构元素中非0元素也需要同时被考虑
③ 计算时，只有当结构元素与其覆盖的图像区域完全相同时，中心像素(结构元原点位置)的值才会被置为1，否则为0。下图给出了一个例子。
源图对应公式中的集合A；结构元素对应公式中的 B

在这里插入图片描述
④ 形态学中的击中与击不中变换，类似于程序中的正则匹配概念

五、一些基本的形态学算法 P412 - P427

在处理二值图像时，形态学的主要应用之一是提取和描述形状的图像成分。特别是我们要考虑提取边界、连通分量、凸壳和区域的骨架的形态学算法。本章节所讨论的二值图像，用1表示阴影区域，而用0表示白色

5.1 边界提取 P412 - P413

$\beta(A)$ 表示集合A的边界，其可以通过先用B对A腐蚀，而后执行A 和腐蚀的结果之间的差集，即
$\beta(A) = A - (A \Theta B)$
其中 B 是一个适当的结构元

在这里插入图片描述

5.2 孔洞填充 P413 - P414

孔洞定义为由前景像素(像素为1)相连的边界所包围的背景区域(像素为0)。（在二值图像中考虑）
令 A 表示一个集合，其元素是 8连通的边界，每个边界包围一个背景区域(即一个孔洞)。当给定每个孔洞中的一点后，目的就是用 1 填充所有的孔洞
$X_k = (X_{k-1} \oplus B) \cap A^c ，k = 1,2,3,...$
式中 $X_0$ 为 a) 包含孔洞中的任意一个点(并设置为1)，b) 与A等大小的集合，B是下图中对称的结构元。如果 $X_k = X_{k + 1}$ ，则算法在迭代的第k步结束。然后，集合 $X_k$ 包含所有被填充的孔洞。 $X_k$ 和 A的并集包含所有 a) 填充的孔洞及这些 b) 孔洞的边界

在这里插入图片描述

对于孔洞填充的数学式子，如果左边不加限制，那么膨胀操作将填充整个区域。然而，每一步中与 $A^c$ 的交集操作将把结果限制到感兴趣区域内。在当前应用中，它被适当的称为条件膨胀

5.3 连通分量的提取 P414 - P415

令 A 是包含一个或多个连通分量的集合，并形成一个阵列 $X_0$ ( a) 该阵列的大小与包含A的阵列的大小相同，除了在对应于 b) A中每个连通分量中一个点的各个已知位置处我们已置1外，该阵列的 c) 所有其他元素均为0)
$X_k = (X_{k-1} \oplus B) \cap A，k = 1,2,3,...$
式中，B是一个适当的结构元(其形状在像素间是基于8连通的)。当 $X_k = X_{k-1}$ 时，迭代过程结束， $X_k$ 包含输入图像中的所有连通分量

在这里插入图片描述

5.4 凸壳 P416 - P417

如果在集合A内连接任意两个点的直线段都在A的内部，则称集合A是凸形
任意集合S的凸壳H 是包含S的最小凸集
一种获得集合A的凸壳 $C (A)$ 的简单形态学算法
① 令 $B^i$ ，i = 1，2，3，4 表示下图中的 4 个结构元(击中或未击中变换是匹配成功时，标记结构元的中心位置为成员。因此当匹配成功时，会将集合A的空白处对应新集合位置均标记为成员)。这个过程可通过执行下式实现：

在这里插入图片描述

式中， $X_0^i = A$ 。
② 当该过程收敛(即当 $X_k^i = X_{k-1}^i$ )，我们令 $D^i = X_k^i$ 。则 A 的凸壳为

在这里插入图片描述
③ 对应与上述数学公式的过程为：
a) 先反复使用 $B^1$ 对 A 做击中或不击中变换(每次的变换结果与 A作并集，所得的并集结果作为下一次击中或不击中变换的原始集合(充当A))
b) 当不再发生进一步变化后(即出现第一次出现击中或未击中结果为空时)，将当前的集合称为 $D^1$
c) 对 $B^2、B^3、B^4$ 重复 a) b) 中的过程分别得到 $D^2、D^3、D^4$
d) 对上述求得的 $D^1、D^2、D^3、D^4$ 四个集合求并集，即可得到原始集合A 的凸壳
在这里插入图片描述

然后上述过程有一个明显的缺点，凸壳可能超出确保凸形所需的最小尺寸。限制这种影响的一种简单方法是限制生长，以便凸壳不会超出初始点在水平和垂直方向上的尺寸

5.5 细化 P417

结构元 B 对集合 A 的细化可表示为 $\bigotimes B$ ，它根据击中或击不中变换来定义：

在这里插入图片描述

对称的细化A 的一种更有用表达方式是以结构元序列为基础的：
${B\} = \{ B^1，B^2，B^3，...，B^n \}$
式中 $B^i$ 是 $B^{i-1}$ 旋转后的形式。使用一个结构元序列将细化定义为：
$\bigotimes \{B\} = ((...((A \bigotimes B^1) \bigotimes B^2)...) \bigotimes B^n)$
这种处理是 A 被 $B^1$ 细化一次，然后得到结果被 $B^2$ 再细化一次，如此进行下去，直到 A 被 $B^n$ 细化一次。整个过程不断重复(将B的序列视为收尾相连的循环序列)，直到得到结果不再发生变换(即当前集合使用所有B的细化结果均一致)

在这里插入图片描述

5.6 粗化 P418

粗化是细化的对偶，定义如下

在这里插入图片描述

式中 B 是适合于粗化处理的结构元(与细化时所用的结构元相同，但是所有的1和0要互换)。与细化一样，粗化处理也可以定义为一系列操作
$\bigodot \{B\} = ((...((A \bigodot B^1) \bigodot B^2)...) \bigodot B^n)$

实际中使用，先对问题中集合的背景进行细化，而后对结果求补集的方式，实现对原始集合的粗化 (使用这种方式的粗化处理，通常会跟随一个消除断点的后处理)

在这里插入图片描述

5.7 骨架 P418 - P420

集合A 的骨架表示为 S(A)

在这里插入图片描述

由上图可以推出：
a) 如果 z 是 S(A)的一个点，并且 $D)_z$ 是A内以z为中心的最大圆盘，则不存在包含 $D)_z$ 且位于A内的更大的圆盘。圆盘 $D)_z$ 称为最大圆盘

b) 圆盘 $D)_z$ 在两个或多个不同的位置与A的边界接触

A 的骨架可以用腐蚀和开操作来表达，即骨架可表示为：

在这里插入图片描述

其中，

在这里插入图片描述

式中，B是结构元，而 $\Theta kB)$ 表示对A的连续k次腐蚀：

在这里插入图片描述

K 是 A 被腐蚀为空集前的最后一次迭代步骤。换句话说，
$max\{k | (A \Theta kB) \neq \varnothing\}$

上述式子可看出，S(A) 可作为骨架子集的并集来得到。同时，可以使用骨架子集重建A：

在这里插入图片描述

式中 $(S_k(A) \oplus kB)$ 表示对 $S_k(A)$ 的 k 次连续膨胀，即

在这里插入图片描述

计算简单图形的骨架

5.8 裁剪 P420 - P421

裁剪方法是对细化和骨架算法的必要补充，因为这些过程会保留某些计生成分，因而需要用后处理来清除这些寄生成分
(例子)考虑消除手写字符 “a” 骨架中的寄生部分

在这里插入图片描述

① 处理思想为，假设任何具有三个或小于三个像素长度的分支都将被删除（主要是为了消除最左侧的 “毛刺”）
② 对输入集合A进行细化可以得到①中期望的结果，即令：
$X_1 = A \otimes \{B\}$
式中 ${B\}$ 对应结构元序列。本例中对应包含图(b) 与图© 中的结构元，并且 $B^i$ 表示的是端点检测子(在击中或不击中变换中定位到集合A中的各种端点)
③ 连续对 A 应用三次上述细化公式(实际反映为连续三次消除集合中的所有端点，主要是为了消除 “毛刺”)。为了将字符 “复原” 为原形状，但要去掉寄生分支(毛刺)，首先需要获取一个包含 $X_1$ 中所有端点的集合 $X_2$

在这里插入图片描述
④ 使用A作为限定器(条件)，对端点进行三次膨胀(为了弥补为了消除 “毛刺”，而使A中其他分支被消除的部分）
$X_3 = (X_2 \oplus H) \cap A$
式子中，H是元素值为1的 3*3 结构元，且每一步之后都要与A求交集。此处属于条件膨胀，其形式类似于连通分量的提取公式。
⑤ 最后取 $X_3$ 与 $X_1$ 的并集就得到期望的结果，
$X_4 = X_1 \cup X_3$

由于在进行字符 “复原” 为原形状的过程中，使用A作条件(A中包含有寄生元素)，使用 A 与端点进行膨胀后结果作的交集时，可能仍然会捡回一些寄生元素

5.9 形态学重建 P421 - P426

形态学重建，它涉及 a) 两幅图像和 b)一个结构元。
① 一幅图像是标记，它包含图像变换的起始点
② 另一幅图像是模板，它用来约束改变换
③ 结构元用来定义连接性
测地膨胀和腐蚀
① 形态学重建的核心是 a) 测地膨胀和 b) 测地腐蚀这两个概念。
② 令 F 表示标记图像，G表示模板图像。假设讨论两幅图像都是二值图像，且 $\subseteq G$ 。 ③ 令 $D_G^{(1)}(F)$ 表示大小(指操作的次数)为 1 的标记图像关于模板的测地膨胀，定义为：
$D_G^{(1)}(F) = (F \oplus B) \cap G$
其中， $\cap$ 表示集合交集（二值图像的交集相当于逻辑与）。F 关于 G 的大小为 n 的测地膨胀定义为：
$D_G^{(n)}(F) = D_G^{(1)}[D_G^{(n-1)}(F)]$
式中， $D_G^{(0)} = F$ 。在这个递推式中，每进行大小为1的 (即每进行一次) 测地膨胀均包含一次与模板G的交集操作，并且交集的结果作为下次测地膨胀的标记图像F。交集算子保证模板 G 将限制标记F的生长(膨胀)，即测地膨胀是，F 以 G 为条件的膨胀

在这里插入图片描述
④ 标记F 关于模板G 的大小(指操作的次数)为1 的测地腐蚀定义为：
$E_G^{(1)}(F) = (F \Theta B) \cup G$
式中， $\cup$ 表示集合的并集 (逻辑或操作)。F 关于 G 的大小为 n 的测地腐蚀定义为：
$E_G^{(n)}(F) = E_G^{(1)}[E_G^{(n-1)}(F)]$
式中， $E_G^{(0)}(F) = F$ 。在这个递推式中，每进行大小为1的 (即每进行一次) 测地腐蚀均包含一次与模板G的并集操作，并且并集的结果作为下次测地腐蚀的标记图像F

在这里插入图片描述

⑤ 有限数量的测地膨胀和腐蚀经过有限数量的迭代步骤后总会收敛，因为标记图像的扩散或收缩受模板约束

用膨胀与腐蚀的形态学重建
① 基于前面的概念，来自标记图像 F 对模板图像 G 的膨胀形态学重建(即标记F 以模板G 为参考的膨胀重建) 表示为 $R_G^D(F)$ ，它被定义为关于 G 的测地膨胀，反复迭代直至达到稳定状态 (即相邻两次的测地膨胀结果相同)；即：
$R_G^D(F) = D_G^{(k)}(F)$
迭代k次，直至 $D_G^{(k)}(F) = D_G^{(k+1)}(F) (即相邻两次的测地膨胀结果相同)$

在这里插入图片描述

② 类似的，模板图像G 对标记图像F 的腐蚀的形态学重建表示为 $R_G^E(F)$ ，它被定义为 F 关于 G 的测地腐蚀，反复迭代直至达到稳定状态(即相邻两次的测地腐蚀结果相同)；即：
$R_G^E(F) = E_G^{(k)}(F)$
迭代k次，直至 $E_G^{(k)}(F) = E_G^{(k+1)}(F) (即相邻两次的测地腐蚀结果相同)$

应用实例
形态学重建有很宽的实际应用领域，每种应用都由 a) 标记图像和 b) 模板图像的选择、c) 所用的结构元及前面讨论中定义的 d) 基本操作的组合来决定
① 重建开操作：用于正确地恢复腐蚀后所保留物体的形状。图像 F 的大小为 n 的重建开操作，定义为 a) 先对 F 进行大小为 n 的腐蚀后，b) 再进行膨胀重建的过程；即：
$O_R^{(n)}(F) = R_F^D[(F \Theta nB)]$
式中， $\Theta nB)$ 表示 B 对 F 的连续 n 次腐蚀。注意，此处 F作为模板
② 填充孔洞：定义与 9.5.2 中一致，但实现算法有不同。前面所述的填充孔洞方式需要已知各孔洞中任意一点的位置，此处谈论的填充孔洞基于形态学重建的全自动化过程(即事先无需知道各孔洞中任一点的位置)
a) 令 I(x,y) 表示一幅二值图像，并假定我们形成了一幅标定图像F(其大小与I(x,y)一致)，F需满足：（I）图像F的边界位置的值为 1 - I；(II) 其他位置均为0，即：
$\begin{cases} 1 - I(x,y)，(x,y)在 I 的边界上\\ 0，其他\\ \end{cases}$
则
$H = [ R_{I^c}^D(F)]^c$
是一幅等于 I 且所有孔洞都被填充的二值图像

在这里插入图片描述

图中使用是所有元素都是1 的 3*3 SE(结构元)
③ 边界清除：是一种删除接触(即连接到)边界的物体的操作。令标本图像F满足：
$\begin{cases} I(x,y)，(x,y)在 I 的边界上\\ 0，其他\\ \end{cases}$
标定图像F，除了在图像 a) 边界位置值为 I 之外，在b) 其他位置均为 0
边界清除算法首先计算形态学重建 $R_I^D(F)$ (简单地提取接触到边界的物体)，然后计算差
$X = I - R_I^D(F)$
以得到一幅其中没有接触边界的物体的图像X

5.10 二值图像形态学操作小结 P426 - P427

在这里插入图片描述

六、灰度级形态学 P428 - P437

本章节把膨胀、腐蚀、开操作和闭操作的基本操作扩展到灰度级图像
使用f(x,y)表示一幅灰度级图像，b(x,y)表示一个结构元。(x,y)表示坐标，f、b 分别表示对应坐标下灰度级像素与结构元成员的值
灰度级形态学中的结构元所执行的基本功能与二值图像中所讨论的相同：它们作为一个 “探测器” 以明确的特性检验一幅给定的图像。灰度级形态学中的结构元分为两类：a) 非平坦和 b) 平坦的结构元

在这里插入图片描述

本章节中所讨论的结构元一般为：高度(SE的值)为1、对称的、平坦的结构元为基础，其原点位于中心处
灰度级形态学中的结构元反射定义为： $\hat b(x,y) = b(-x,-y)$

6.1 腐蚀和膨胀 P428 - P430

当 b 的原点位于(x,y)处时，用一个平坦的结构元b 在 (x,y) 处对图像 f 的腐蚀定义为图像F 中与b重合区域的最小值。以公式的形式，结构元素b对一幅图像在位置(x,y)处的腐蚀由下式给出：

在这里插入图片描述

执行过程类似于第三章讲的 “空间相关”(即掩模不旋转180°的滑动处理过程) ，每一次查找出的重合部分f的最小值赋值给，新图像中对应的结构元滑过时对应的原点位置

类似的，当 $\hat b$ 的原点位于位置(x,y)处时，平坦结构元b 在任何位置(x,y)处对图像f的膨胀，定义为图像f 与 $\hat b$ 重合区域的最大值，即

在这里插入图片描述

执行过程类似于第三章讲的 “空间卷积” (即掩模旋转180°的滑动处理过程)，每一次查找出的重合部分f的最大值赋值给，新图像中对应的结构元滑过时对应的原点位置

使用非平坦结构元的腐蚀

在这里插入图片描述

使用非平坦结构元的膨胀

在这里插入图片描述

灰度图中腐蚀与膨胀处理的对偶性

在这里插入图片描述

6.2 开操作与闭操作 P430 - P431

灰度图像的开操作与闭操作的表达式与二值图像对应的操作具有相同的形式
灰度图像的开操作

在这里插入图片描述

灰度图像的闭操作
灰度图像的开、闭操作的对偶性

在这里插入图片描述

和

在这里插入图片描述

灰度图像开操作与闭操作的几何解释
① 灰度图像的开操作的几何解释
a) 假设将一幅图像函数 f(x,y) 视为一个三维表面（它的灰度值可解释为xy平面上的高度值，如下图所示）
b) b 对 f 的开操作可解释为，从 f 的下表面向上推动结构元时，b的任何部分所达到的最高值。这样，完全开操作就是由 b 的原点访问 f 的每个坐标(x,y)所得到的所有值的集合。以一维的形式说明这个概念

在这里插入图片描述

开操作会剪掉峰值，从而降低小区域的亮度；
闭操作会填补较窄的低灰度 “凹区域” ，从而增加小区域的亮度；
② 灰度图像的闭操作的几何解释
对应上图中的(d)、(e)
③ 开操作，用于去除较小的明亮细节，而保持整体灰度级和较大的明亮区域特征相对不变
④ 闭操作，用于增亮较小的暗细节，而保持整体灰度级和较大暗区域特征相对不变

总结
① 开操作抑制比结构元小的亮细节
② 闭操作抑制比结构元小的暗细节

6.3 一些基本的灰度级形态学算法 P431 - P435

形态学平滑
由于开操作抑制比结构元小的亮细节，闭操作抑制暗细节，所以常常以形态滤波的形式结合起来平滑图像和去除噪声

形态学梯度
膨胀和腐蚀可与图像相减结合起来得到一幅图像的形态学梯度，形态学梯度由 g 定义：

在这里插入图片描述

膨胀粗化(增亮)一幅图像中的区域，而腐蚀则细化(暗化)它们。膨胀与腐蚀之差强调区域间的边界

顶帽变换和底帽变换
图像相减与开操作和闭操作相结合，可产生所谓的 top-hat(顶帽)变换和 bottom-hat(底帽)变换。
① 灰度级图像 f 的顶帽变换定义为 f 减去其开操作：
$T_{hat}(f) = f - (f \circ b)$
即得到被结构元减去的峰值
② 灰度级图像 f 的底帽变换定义为 f的闭操作减去f：
$B_{hat}(f) = (f \cdot b) - f$
即得到被结构元填补的凹区域
③ 这些变换的主要应用之一是，在开操作或闭操作中用一个与要被删除物体不拟合(拟合指接触面相贴合) 的结构元，来从一幅图像中删除物体。然后，差操作得到一幅仅保留已删除分量的图像。
注意：顶帽变换用于暗背景上的亮物体，而底帽变换则用于相反的情况。由于这个原因，当我们谈到这两个变换时，常常分别称为白顶帽变换和黑底帽变换

粒度测定

在这里插入图片描述

纹理分割 P434
见书中

6.4 灰度级形态学重建 P435 - P437

灰度级形态学重建基本按照二值图像形态学重建中相同的方法定义
测地膨胀与测地腐蚀
① 令 f 和 g 分别代表标记图像和模板图像。假设 f 和 g 是大小相同的灰度级图像，且 f <= g。f 关于 g 的大小(操作的次数)为1得测地膨胀定义为：
$D_g^{(1)}(f) = (f \oplus b) \land g$
式中， $\land$ 表示点方式的最小算子。该式指出，大小为1的测地膨胀是：a) 先计算 b 对 f 的膨胀，b) 然后选择在每个(x,y)点出该结果和 g 间的最小者。f 关于 g 的大小为n的测地膨胀定义为：
$D_g^{(n)}(f) = D_g^{(1)}[D_g^{(n-1)}(f)]$
并有 $D_g^{(0)} = f$
② 类似的，f关于g的大小(操作的次数)为1的测地腐蚀定义为
$E_g^{(1)}(f) = (f \Theta b) \lor g$
式中， $\lor$ 表示点方式的最大算子。该式指出，大小为1的测地腐蚀是：a) 先计算 b 对 f 的腐蚀，b) 然后选择在每个(x,y)点出该结果和 g 间的最大者。f 关于 g 的大小为n的测地腐蚀定义为：
$E_g^{(n)}(f) = E_g^{(1)}[E_g^{(n-1)}(f)]$
并有 $E_G^{(0)} = f$
灰度图像中，用膨胀和腐蚀的形态学重建
① 灰度级标记图像f对灰度级模板图像g的膨胀形态学重建，定义为f关于f的测地膨胀反复迭代，直至达到稳定；即：
$R_g^D(f) = D_g^(k)(f)$
且k为使 $D_g^(k)(f) = D_g^(k+1)(f)$ 成立的最小值
② f 对 g 的腐蚀的形态学重建类似的定义为
$R_g^E(f) = E_g^(k)(f)$
且k为使 $E_g^(k)(f) = E_g^(k+1)(f)$ 成立的最小值
重建开操作与重建闭操作
① 图像f 的大小(操作次数)为 n 的重建开操作定义为，a) 先对f进行大小为n的腐蚀，b) 在由 f 的膨胀重建；即