文章目录
第 11 章表示和描述
引言
11 .1 表示
Moore 边界追踪算法:
- 令起始点 b 0 b_0 b0为图像中左上角标记为1的点。使用 c 0 c_0 c0表示 b 0 b_0 b0 西侧的邻点。从 c 0 c_0 c0开始按顺时针方向考察 b 0 b_0 b0 的8个邻点。令 b 1 b_1 b1表示所遇到的值为1的第一个邻点,并直接令 c 0 c_0 c0是序列中 b 1 b_1 b1之前的点。存储 b 0 b_0 b0和 b 1 b_1 b1的位置,以便在步骤5中使用
- 令 b 1 b_1 b1和 c 1 c_1 c1
- 从c开始按顺时针方向行进,令b的8个邻点为n1,n2,…,n8 n1,n2,…,n8找到标记为1的第一个nk
- 令b = n k n_k nk和c = n k − 1 n_{k-1} nk−1
- 重复步骤3和步骤4, 当算法停止时,所找到的b点的序列就构成了排列后的边界点的集合
链码
用于表示由顺次连接的具有指定长度和方向的直线段组成的边界。 这种表示基于线段的4连接或8连接。每个线段的方向用数字编码方案编码。也称为佛雷曼链码。
数字边界可以用多边形以任意精度来近似。 对于一条闭合边界,当多边形的边数等于边界上的点数时,这种近似会变得很精确。
最小周长多边形的多边形近似(MPP)
聚合技术
沿一条边界来聚合一些点,直到拟合这些聚合点的直线的最小均方误差超过一个预设的阈值。 当这种条件出现时,存储该直线的参数,将误差设为零,并且重复该过程,沿边界聚合新的点,直到该误差再次超过预设的阈值。 这一过程结束后,相邻线段的交点就构成多边形的顶点。
分裂技术
将线段不断地细分为两部分,直到满足规定的准则为止。
边界线段
将边界分解为线段,分解降低了边界的复杂性,从而简化了描述过程。
骨架
表示一个平面区域的结构形状的一种重要方法是将它简化为图形。 这种简化可以通过一种细化(也称为骨架化)算法得到该区域的骨架来实现。 在大范围的图像处理问题中,细化过程起着核心作用。
11 .2 边界描绘子
边界的长度是其最简单的描绘子之一。
一条边界上的像索数量可以给出其长度的粗略近似。
边界B的直径定义为
D
i
a
m
(
B
)
=
m
a
x
i
,
j
[
D
(
p
i
,
p
j
)
]
Diam(B)=max_{i,j}[D(p_i,p_j)]
Diam(B)=maxi,j[D(pi,pj)]
D 是一种距离度量,
p
i
,
p
j
p_i,p_j
pi,pj 均是边界上的点。
直径的值和连接组成该直径两个端点的直线段(该直线称为边界的长轴)的方向是边界的有用描述子,边界的短轴定义为与长轴垂直的直线,且由边界与两个轴相交的4个外部点所组成的方框(该方框称为基本矩形),可以全完包围该边界。
连接边界最远点对的线段称为边界的长轴。边界短轴 定义为与长轴垂直的线段。长轴和短轴所形成的矩形完全包含了边界,该矩形称为基本矩形。长轴和短轴的比率是边界的偏心率。
形状数
形状数是根据链码的一次差分得出的。
傅里叶描绘子
a
(
u
)
=
∑
k
=
0
K
−
1
s
(
k
)
e
−
j
2
π
u
k
/
K
a(u) = \sum_{k=0}^{K-1}s(k)e^{-j2πuk/K}
a(u)=k=0∑K−1s(k)e−j2πuk/K
统计矩
边界线段(和标记图波形)的形状可使用统计矩来定量描述,如均值、方差和高阶矩。
11 .3 区域描绘子
一个区域的面积定义为该区域中像素的数量。 区域的周长是其边界的长度。 一个区域的致密’性,定义为
(
周长
)
2
(周长)^2
(周长)2/面积。标量乘子内致密性描绘子是圆度率,即一个区域的面积与具有相同周长的一个圆(最致密的形状)的面积之比。周长为 P 的一个圆的面积为
p
2
/
4
π
p^2 / 4π
p2/4π 。因此.圆度率$ R_C $由下式给出 :
R
c
=
4
π
A
p
2
R_c = \frac{4πA}{p^2}
Rc=p24πA
A 是所讨论区域的面积, P 是其周长。 对于圆形区域,该度量值为 1 ,对于方形区域.该度最值为π/4。 致密性是一个无量纲的度量。
拓扑描绘子
拓扑学是研究未受任何变形影响的图形的性质, 前提是该图形未被撕裂或粘连(有时称为橡皮膜变形) 。
纹理
不存在纹理的正式定义,但在直觉上,这种描绘子提供了诸如平滑度、粗糙度和规律性等特性的度量。图像处理中用于描述区域纹理的三种主要方法是统计方法、结构方法和频谱方法。
- 统计法:获得诸如平滑、粗糙、粒状等纹理特征。
- 结构法:处理图像像元的排列,如基于规则间距平行线的纹理描述。
- 频谱法:基于傅里叶频谱的特性,主要用于检测图像中的全局周期性,方法是识别频谱中的高能量的窄波峰。
11.4 使用主分量进行描绘
假设我们将A 用做将向量 x 映射为向量y 的一个变换矩阵,如下所示:
y
=
A
(
x
−
m
x
)
y = A(x-mx )
y=A(x−mx)
该表达式称为霍特林变换 由于使用对应于最大特征值的特征向量这一思想,霍特林变换也称为主分量变换。
11.5关系描绘子
因为字符串是一维结构,所以将字符串应用于图像描述时,需要建立一种适当的方法来将二维位置关系简化为一维形式。 大多数使用字符串来描述图像的应用均基于从感兴趣物体中提取连接线段的思想。一种方法是追踪一个物体的轮廓,并使用指定方向和/或长度的线段来对结果进行编码。
另一种更为通用的方法是使用有向线段来描述图像的各个部分。
11.6小结
本章介绍了图像分割后,对分割后的模块进行表示和描绘。具体选择其中的哪一种方法,将取决于所考虑的问题。
第 12 章目标识别
引言
模式识别方法主要分为两大领域:决策理论方法和结构方法。
决策理论方法处理的是使用定量描绘子来描述的各种模式,如长度、面积和纹理等。
结构方法处理的是由定性描绘子来描述的各种模式,
12.1 模式和模式类
模式是描绘子的组合,在有关模式识别文献中经常使用特征来表示描绘子。
模式类是指具有某些共同属性的一族模式。
实践中常用的三种模式组合是向量(用于定量描述)、串和树(用于结构描述) 。
12.2 基于决策理论方法的识别
决策理论方法识别是以使用决策(或判别)函数为基础的
匹配
基于匹配的识别技术通过一个原型模式向量来表示每个类。 根据一种预先定义的度量,将一个未知模式赋予最接近的类。
最小距离分类器
m j = 1 N j ∑ X ∈ ω j x j j = 1 , 2 , . . . W m_j = \frac{1}{N_j}\sum_{X \in\omega_j}x_j \ \ \ \ \ \ \ j =1,2,...W mj=Nj1X∈ωj∑xj j=1,2,...W
N j N_j Nj是来自 ω j \omega_j ωj类模式向量的数量,求和操作是对所有这些向量执行的 。 W 是模式类的数量。
最佳统计分类器
来自类别
ω
j
\omega_j
ωj特定模式 x 的概率表示为
p
(
ω
j
/
x
)
p(\omega_j/x)
p(ωj/x) 。如果模式分类器判断 x 来自类
ω
j
\omega_j
ωj,而实际上它来自类
ω
i
\omega_i
ωi,那么分类器就会导致一次损失,表示为
L
i
j
L_{ij}
Lij。 由于模式 x 可能属于所考虑的 W 个类中的任何一个类,故将模式 x 赋予类
ω
j
\omega_j
ωj的平均损失为
r j ( x ) = ∑ + k = 1 W L k j p ( ω k / x ) r_j(x) = \sum+{k=1}^WL_{kj}p(\omega_k/x) rj(x)=∑+k=1WLkjp(ωk/x)
该式在决策理论术语中通常称为条件平均风险或损失。
神经网络
使用样本模式来估计每个模式类的统计参数。 最小距离分类器完全由每个类的均值向量来确定。 类似地,对于总体为高斯分布的贝叶斯分类器完全由每个类的均值向量和协方差矩阵确定。 用于估计这些参数的(已知其所属的类)模式通常称为训练模式,来向每个类的这样一
组模式称为训练集。 使用训练集得到决策函数的过程称为学习或训练。
12.3 结构方法
两个区域边界(形状)之间的相似度k 定义为它们的形状数仍保持一致的最大阶。
12.4小结
本章介绍图像处理的重要用途,模式识别与识别中涉及到的基础知识。