目录
12.1模式和模式类
模式是描绘子的组合,模式类是指具有某些共同属性的一族模式。实践中常用的三种模式组合是向量(用于定量描述)、串和树(用于结构描述)。模式向量由粗体小写字母表示,如x,y和z,并采取下列形式:
其中,每个分量x,表示第i个描绘子,n是与该模式有关的描绘子的总数。模式向量以列向量(即n×1阶矩阵)的形式表示。
12.2基于决策理论方法的识别
12.2.1匹配
基于匹配的识别技术通过一个原型模式向量来表示每个类。根据一种预先定义的度量,将一个未知模式赋予最接近的类。最简单的方法是最小距离分类器。
最小距离分类器
我们把每个模式类的原型定义为该类模式的平均向量:
其中,N,是来自w,类模式向量的数量,求和操作是对所有这些向量执行的。
相关匹配
大小为m×n的模版w(x,y)与图像f(x,y)的相关可表示为:
其中,求和的上下限取w和f的共同范围。
12.2.2最佳统计分类器
在给定数据集和评估标准下,能够达到最优性能的分类模型或算法。选择最佳分类器通常依赖于数据的特性、问题的复杂度以及预期的性能指标。
高斯模式类的贝叶斯分类器
在n维情形下,第j个模式类中的向量的高斯密度为:
三维模式的贝叶斯分类器
三维模式的贝叶斯分类器指的是在一个三维特征空间中应用贝叶斯定理进行分类的方法。这种方法通常用于解决具有连续特征的分类问题,其中每个样本都由三个特征组成,可以表示为 ( (x_1, x_2, x_3) ),其中 ( x_1, x_2, x_3 ) 分别表示三个特征的取值。
12.2.3神经网络
训练模式:用于估计参数(已知其所属的类)的模式
训练集:来自每个类的一组模式
学习或训练:使用训练集得到决策函数的过程
在这种最基本的形式中,感知机学习一个线性决策函数,该决策函数对分两个线性可分的训练集。图12.14(a)图示地显示了两个模式类的感知机模型。这个基本装置的响应基于其输入的加权和,即:
训练算法:在机器学习和数据科学中,用来根据给定的数据集和目标函数(损失函数)调整模型参数的过程。训练算法的主要目标是使模型能够从数据中学习并表现出预期的行为或性能。具体来说,训练算法通常包括以下几个关键步骤:
1.准备数据2.选择模型3.定义目标4.函数选择5.优化方法6.训练模型7.评估模型8.调整和优化
12.3结构方法
12.3.1匹配形状数
为了比较根据形状数描述的区域边界,我们可以明确表达一个过程,例如,令a和b代表由4方向链码表示的闭合边界的形状数。如果:
那么这两个形状有一个相似度k,其中s代表形状数,下标代表阶。
12.3.2串匹配
假设两个区域边界a和b已被编码成串,两个串分别表示为a₁,a₂.…,a和b,b₂…,bmo令α表示两个串之间的匹配数,如果a=bk,则匹配出现在第k个位置。不匹配的符号数为:
其中,largl是该宗量的串表示的长度(符号数)。a和b间的一种简单的相似性度量是比率: