数字图像处理第十二章目标识别

ModelBulider

已于 2024-08-23 21:37:16 修改

阅读量727

点赞数 38

分类专栏：数字图像处理（理论篇）文章标签：计算机视觉人工智能图像处理

于 2024-08-07 08:00:00 首次发布

本文链接：https://blog.csdn.net/weixin_44063529/article/details/140881868

版权

数字图像处理（理论篇）专栏收录该内容

17 篇文章 0 订阅

订阅专栏

在这里插入图片描述

文章目录

引言 P557
一、模式和模式类 P557 - P560
二、基于决策理论方法的识别 P560 - P585
三、结构方法 P585 - P587
- 3.1 匹配形状数 P585 - P586
- 3.2 串匹配 P586 - P587
本章知识点总结

引言 P557

识别是基于目标的描述给该目标赋予标志的过程
本章介绍的模式识别方法主要分为两个领域：
① 决策理论方法：处理的是使用定量描绘子来描述的各种模式，如长度、面积和纹理等
② 结构方法：处理的是由定性描绘子来描述的各种模式
识别的核心问题是通过样本模式进行 “学习” 这一概念

一、模式和模式类 P557 - P560

模式是描绘子的组合。在有关模式识别文献中经常使用特征来表示描绘子
模式类是具有共同属性的一族模式。模式类用 $\omega_1,\omega_2,...,\omega_W$ 表示，其中 W是模式类数
由机器完成的 a) 模式识别涉及自动化地且 b) 人为干预尽可能少地将不同模式赋予不同类别的技术
模式与模式类概念自总结
① 模式类似于编程中对象的概念
② 模式类类似于编程中类的概念
实践中常用的三种模式组合是：a) 向量(用于定量描述)、b) 串(用于结构描述)、c) 树(用于结构描述)
模式向量
① 模式向量由粗体小写字母表示，如 $x, y 和 z$ ，并采用下列形式
$\begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{bmatrix}$
或
$\begin{bmatrix} x_1&x_2&\cdots&x_n \end{bmatrix}^T$
式中，每个分量 $x_i$ 表示第 i 个描绘子，n 是与该模式有关的描绘子的总数
② 模式向量x中的各个分量(描述子)的性质，取决于用于描述该物理模式本身的方法

在这里插入图片描述

模式向量、串和树概念自总结
① 模式向量中的各分量(描述子)性质，取决于描述物理模式本身的方法。模式向量由定量信息(描述子)表征
② 对于指纹识别等问题，使用结构方法通常能得到解决，因为这种问题不仅 a) 定量度量每个特性，而且 b)这些特性间的空间关系决定了(模式)类别的成员
③ 串描述适合于生成其结构是基于基元的简单链接，并且通常是和边界形状有关系的目标模式和其他实体模式
④ 对于多层排序方案都会导致树结构

二、基于决策理论方法的识别 P560 - P585

决策理论方法处理的是使用定量描绘子来描述的各种模式(模式向量)
决策理论方法识别以使用决策(或判别)函数为基础
在决策理论方法识别的探讨中
① 令 $x = (x_1,x_2,...,x_n)^T$ 表示 n 维模式向量
② 对于 W 个模式类 $\omega_1,\omega_2,...,\omega_W$ ，决策理论模式识别的基本问题是依据如下属性找到 W 个决策函数 $d_1()，d_2()，...,d_W()$ ：
a) 如果模式 $x$ 属于类 $\omega_i$ ，则
$d_i(x) = > d_j(x) ，j = 1,2,...,W；j \neq i$
b) 换句话解释 a）中式子。即：将 $x$ 代入所有决策函数后，如果 $d_i(x)$ 得到最大值，则称未知模式x 属于第 i 个模式类。该关系可以任意求解
③ 将类 $\omega_i$ 从类 $\omega_j$ 中分离出来的决策边界，由满足 $d_i(x) = d_j(x)$ 的 $x$ 值给出，或等价地由
$d_i(x) - d_j(x) = 0$
的 $x$ 值给出
a) 通常的做法，使用单一函数 $d_{ij} = d_i(x) - d_j(y) = 0$ 来识别两个类之间的决策边界。因此模式类 $\omega_i$ 有 $d_{ij}(x) > 0$ ，而对于模式类 $\omega_j$ 有 $d_{ij}(x) < 0$
决策函数理论自总结
① 每个模式类 $x$ 对应一个决策函数 $d_i(x)$ ，决策函数的返回值大小反映了：某一模式 $x$ 属于模式类 $\omega_i$ 的程度，决策函数的返回值越大从属程度越高，其中最大返回值决定模式从属于哪个模式类

2.1 匹配 P560 - P564

基于匹配的识别技术通过一个原型模式向量来表示每个类。根据一种预先定义的测度，将一个未知模式赋予最近的类。
① 最简单的方法是最小距离分类器，如其名称所示，最小距离分类器计算该未知模式与每个原型向量间的(欧氏)距离。它选择最小距离来决策。
② 还有一种基于相关的方法，该方法可根据图像用公式来直接表达
最小距离分类器
① 假设我们把每个模式类的原型定义为该类模式的平均向量：
$m_j = \frac{1}{N_j}\sum_{x \in \omega_j} x_j，j = 1,2,...,W$
式中， $N_j$ 是来自 $\omega_j$ 类模式向量的数量，求和操作对所有这些向量执行(即对于所有同模式类的样本所对应的模式向量)。W是模式类的个数
② 求位置模式向量 $x$ 的类成员的一种方法是，将他赋给其最接近的原型类。使用欧氏距离求接近程度可将该问题简化为计算如下距离测度：
$D_j(x) = \Vert x - m_j \Vert ，j = 1,2,..,W$
然后，若D_i(x)最小距离，则把 $x$ 赋给类 $\omega_i$ 。也就是说距离意味着该式表现最好的匹配
即：以未知模式向量距各模式类的原型模式向量的距离，判定该未知模式向量从属于哪个模式类
③ 对于最小距离分类器对应的 $d_j(x)$ (决策函数，其返回最大值时等效于上述的最小距离时的情况，并且决定模式向量的归属)：
$d_j(x) = x^Tm_j - \frac{1}{2}m_j^T m_j ，j = 1,2,...,W$
并在 $d_i(x)$ 取最大数值时，将 $x$ 划归类 $\omega_i$ 。该函数等同于选择最小距离(即二值目标一致，均能确定 $x$ 属于哪个类 $\omega_i$ )
④ 对于最小距离分类器，类 $\omega_i$ 和类 $\omega_j$ 之间的决策边界为
$d_{ij}(x) = d_i(x) - d_j(x) = x^T(m_i - m_j) - \frac{1}{2}(m_i - m_j)^T (m_i + m_j) = 0$
式中给出的决策面是连接 $m_i$ 和 $m_j$ 的线段的垂直等分线。n表示模式向量中分量(描绘子)的个数。n = 2，垂直等分线是一条直线；n = 3时，它是一个平面；n > 3时，它是一个超平面

在这里插入图片描述

相关匹配
① 大小为 m*n 的模板 $w (x, y)$ 与图像f(x,y)的相关可表示为
$\sum_s \sum_s w(s,t)f(x+s,y+t)$
其中，求和的上下限取 w 和 f 的共同范围（滑动时的重叠部分）。空间相关通过相关定理与函数的变换相联系（傅里叶变换对）：

在这里插入图片描述

式中，在这里插入图片描述表示空间相关， $F^*$ 是 F 的共轭复根
② 归一化相关系数(反映模板图像(w) 与目标图像( $f (x, y)$ )中与之同大小区域的相关性)：
$\gamma(x,y) = \frac{\displaystyle\sum_s \displaystyle\sum_t[w(s,t) - \overline w]\displaystyle\sum_s \displaystyle\sum_t[f(x+s,y+t) - \overline f_{xy}]}{\{ \displaystyle\sum_s \displaystyle\sum_t[w(s,t) - \overline w]^2 \displaystyle\sum_s \displaystyle\sum_t[f(x+s,y+t) - \overline f_{xy}]^2 \}^\frac{1}{2}}$
其中，求和的上下限取 $w$ 和 $f$ 的共同范围(滑动时，重合的区域)， $\overline w$ 是模板的平均值(模板系数的平均值，只计算一次)， $\overline f_{xy}$ 是 $f$ 中与 $w$ 重合区域的平均值。通常，我们将 $w$ 称为模板，而将相关称为模板匹配。 $\gamma(x,y)$ 的值域为 [-1,1]，因而 $f$ 和 $w$ 的幅值变化是归一化的。
a) 当个归一化的 $w$ 和 $f$ 中对应的归一化区域相同时， $\gamma(x,y)$ 出现最大值。这说明最大相关(即最可能匹配)。
b) 当两个归一化函数在归一化系数求解中为最小值时，则两个归一化函数具有为最小相似性。
在这里插入图片描述

2.2 最佳统计分类器 P564 - P570

考虑一种识别的概率方法。在平均意义上有可能推导出一种最佳分类方法，用这种方法会产生最低的错误分类的概率
基础知识
① 来自类 $\omega_i$ 的特定模式x 的概率表示为 $p(\omega_i / x)$ (即表示x是来自 $\omega_i$ 的概率)
② 如果模式分类器判断 x 是来自(从属于) 类 $\omega_j$ ，而实际上它来自类 $\omega_i$ ，那么分类器就会导致一次损失(即分类器分错时的损失量)，表示为 $L_{ij}$ 。由于 x 可能属于所考虑的 W 个类中的任何一个类，故将模式 x 赋予类 $\omega_j$ 的平均损失为
$r_j(x) = \displaystyle\sum_{k=1}^W L_{kj} p(\omega_k / x)$
该式在决策理论属于中通常称为 a) 条件平均风险或 b) 损失
③ 由 $p (A ∣ B) = [p (A) p (B ∣ A)] / p (B)$ (条件概率知识)进一步推导 ② 中式子，可得
$r_j(x) = \frac{1}{p(x)}\displaystyle\sum_{k=1}^W L_{kj} p(x/\omega_k) P(\omega_k)$
式中， $p(x/\omega_k)$ 是来自 $\omega_k$ 的模式的概率密度函数， $P(\omega_k)$ 是类 $\omega_k$ 出现的概率。由于 $1/ p (x)$ 为正，且对所有的 $r_j(x)$ ，j = 1,2,…,W 均是如此，因此忽略该项，可得简化后的平均损失表达式为：
$r_j(x) = \displaystyle\sum_{k=1}^W L_{kj} p(x / \omega_k) P(\omega_k)$
④ 分类器由 W 个可能的类，任何给定的位置模式可从这些类中选择。如果分类器的每个模式 x 计算 $r_1(x),r_2(x),...,r_W(x)$ ，并将该模式最低损失赋给相应的类，则关于所有决策(即对不同模式进行的全部决策判定)的总体平均损失将是最低的。这种将总体平均损失降至最低的分类器称为贝叶斯分类器。因此，如果 $r_i(x) < r_j(x)，j = 1,2,...,W 且 j \neq = i$ ，那么贝叶斯分类器将未知模式x赋给 $ \omega_i $ 。换句话说，如果对所有的 j 且 $\neq i$ 有

$\displaystyle\sum_{k=1}^W L_{ki} p(x / \omega_k) P(\omega_k) < \displaystyle\sum_{q=1}^W L_{qi} p(x / \omega_q) P(\omega_q)$
那么 x 将赋值给 $\omega_i$ (即：将未知模式以最小损失赋给相应的类)

⑤ 正确的决策的损失通常被赋予零值，而不正确的损失通常被赋予相同的非零值(譬如值1)。按照这样的条件，损失函数变为：
$L_{ij}(x) = 1 - \delta_{ij}$
式中，

a) $i = j$ 时， $\delta_{ij} = 1$
b) $\neq j$ 时， $\delta_{ij} = 0$
即：不正确的决策的损失为 1，正确的损失为 0

⑥ 整合上述各式
a) $r_j(x) = \displaystyle\sum_{k=1}^W (1 - \delta_{kj}) p(x / \omega_k) P(\omega_k) = \displaystyle\sum_{k=1}^W p(x / \omega_k) P(\omega_k) - p(x / \omega_j) P(\omega_j)$
$\omega_j) P(\omega_j)$
b) 若对于所有的 $\neq i$ 均有：(即存最小损失值)
$\omega_i) P(\omega_i) < p(x) - p(x / \omega_j) P(\omega_j)$
c) 等效于 b）中的式子：
$\omega_i) P(\omega_i) > p(x / \omega_j) P(\omega_j)，j = 1,2,...,W$
此时，贝叶斯分类器将模式 x 赋给类 $\omega_i$ 。
d) 得到，0-1 损失函数的贝叶斯分类器对应的决策函数为：
$d_j(x) = p(x / \omega_j) P(\omega_j)，j = 1,2,...,W$
式中，模式向量 x 赋给其决策函数取得最大值的类
高斯模式类的贝叶斯分类器
① 考虑贝叶斯分类器的决策函数，
$d_j(x) = p(x / \omega_j) P(\omega_j)，j = 1,2,...,W$
其中， $\omega_j)$ ：概率密度函数，受模式向量的分量数目 n 的影响，可能是 n 元函数，如果其函数形式未定，则在实际应用中很困难实现。由于这个原因，使用贝叶斯分类器时，通常假设对各种密度函数有一个解析表达式，且来自每个类的样本模式有一个必须的参数估计。目前， $\omega_j)$ 的最为通用的假设形式是高斯概率密度函数
②

2.3 神经网络 P570 - P585

前面讨论的方法使用样本模式来估计每个模式类。最小距离分类器完全由每个类均值向量来确定。类似的，对于总体为高斯分布的贝叶斯分类器，完全由每个类的 a)均值向量和 b)协方差均值来确定。
① 用于估计这些参数的(已知其所属的类)模式通常称为训练模式，来自每个类的这样一组模式称为训练集。
② 使用训练集得到的决策函数的过程称为学习或训练
对于最小距离分类器与贝叶斯分类器，训练很简单。每个类的训练模式被用于计算对应于该类的决策函数的参数。估计出问题中的参数后，分类器的结构也被固定，且其最终的性能将取决于实际模式总体是否满足分类方法推导所做的统计假设
但是一个问题中的模式类的统计特性通常是未知的，或者是无法估计的。实际上，此类决策理论问题最好由直接通过训练生成所需决策函数的方法来处理。然后，没有必要再做关于 a)基本的概率密度函数或 b)关于所考虑模式类的其他概率信息的假设
背景知识
① 基于神经网络实现决策的本质是基于非线性计算单元(称为神经元)，这些单元以网络的形式进行组织，就像大脑中互联的神经元那样。以此得到的模型我们称之为神经网络
两个模式类的感知机
① 感知机：学习一个线性决策函数，用以正确地分离训练集的模式表示的类(即分离不同训练集表示的类)
② 在这种最基本的形式中，感知机学习一个线性决策函数，该决策函数对分两个线性可分的训练集。图 12.14（a）显示了两个模式类的感知机模型。

这个基本装置的响应基于其输入的加权和，即
$\displaystyle\sum_{i=1}^n w_i x_i + w_{n+1}$
在这里插入图片描述

在这里插入图片描述

训练算法
① 线性可分算法

在这里插入图片描述

② 不可分类(不存在（超）平面分割训练集)

在这里插入图片描述

③ 多层前馈神经网络
a) 基本结构
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
b) 反向传播训练

在这里插入图片描述

c) 决策面的复杂性
在这里插入图片描述

在这里插入图片描述

三、结构方法 P585 - P587

12.2 节中讨论的技术可定量地处理模式，并且忽略了模式形状中固有的结构关系。本节讨论的结构方法可通过精确地运用这些类型的关系来实现模式识别的目的

3.1 匹配形状数 P585 - P586

在这里插入图片描述

3.2 串匹配 P586 - P587

在这里插入图片描述

本章知识点总结

模式与模式类概念自总结
① 模式类似于编程中对象的概念
② 模式类类似于编程中类的概念
模式向量、串和树概念自总结
① 模式向量中的各分量(描述子)性质，取决于描述物理模式本身的方法。模式向量由定量信息(描述子)表征
② 对于指纹识别等问题，使用结构方法通常能得到解决，因为这种问题不仅 a) 定量度量每个特性，而且 b)这些特性间的空间关系决定了(模式)类别的成员
③ 串描述适合于生成其结构是基于基元的简单链接，并且通常是和边界形状有关系的目标模式和其他实体模式
④ 对于多层排序方案都会导致树结构
决策函数理论自总结
① 每个模式类 $x$ 对应一个决策函数 $d_i(x)$ ，决策函数的返回值大小反映了：某一模式 $x$ 属于模式类 $\omega_i$ 的程度，决策函数的返回值越大从属程度越高，其中最大返回值决定模式从属于哪个模式类

ModelBulider

关注

38
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
数字图像处理第十二章目标识别

本文详细介绍了数字图像处理中目标识别的方法，包括基于决策理论和结构方法的识别技术。决策理论方法通过定量描述子和统计分类器进行模式识别，而结构方法则利用定性描述子处理模式。文章还探讨了模式向量、串匹配和神经网络等关键概念，并总结了模式识别的核心知识点，为图像处理领域的专业人士提供了宝贵的理论和实践指导。
复制链接

扫一扫