【模式识别】模式识别的概述(一)

本节主要内容:

  1. 模式和模式识别的概念
  2. 模式识别的发展简史和应用
  3. 模式识别的主要方法
  4. 模式识别的系统和实例
  5. 几个相关的数学概念

1、模式和模式识别的概念

 什么是模式(Pattern)?

广义地说,存在于时间和空间中可观察的事物,如果我们可以区别他们是否相同或是否相似,都可以称之为模式。

模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。

模式的直观特性:

——可观察性

——可区分性

——相似性

 模式识别的概念

模式识别—直观,无所不在,“人以类聚,物以群分”

——周围物体的认知:桌子、椅子

——人的识别:张三、李四

——声音的辨别:汽车。火车、狗叫、人语

——气味的分辨:炸带鱼、红烧肉

人和动物的识别能力是极为平常的,但对计算机来说却是非常困难的。

模式识别的研究

目的:利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。

Y=F(X)

——X的定义域去取自特征集

——Y的值域为类别的标号集

——F是模式识别的判别方法

2、模式识别的应用(举例)

工程

——产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析

军事

——航空摄像分析、雷达和声纳信号检测和分类、自动目标识别

安全

——指纹识别、人脸识别、监视和报警系统

3、模式识别的主要方法

模式识别的方法

模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。

——特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。

——解释空间:将c个类别表示为,i=1,2,...,c

        其中,为所属类别的集合,称为解释空间。

假说的两种获得方法

监督学习、概念驱动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知的样本上得到近似的结果。

——依靠已知所属类别的训练样本集,按它们特征向量的分布来确定假说(通常为一个判别函数),在判别函数确定之后能用它对未知的模式进行分类;

——对分类的模式要有足够的先验知识。通常需要采集足够数量的具有典型性的样本进行训练。

非监督学习。数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。

——在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况;

——如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类;

——这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。

模式分类的主要方法

  • 数据聚类
  • 统计分类
  • 结构模式识别
  • 神经网络

  数据聚类

  • 目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。
  • 是一种非监督学习的方法,解决方案是数据驱动的。

  统计分类

  • 基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。
  • 特征向量分布的获得是基于一个类别已知的训练样本集。
  • 是一种监督分类的方法,分类器是概念驱动的

  结构模式识别

  • 该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。
  • 识别采用结构匹配的形式,通过计算一个匹配程度值(matching score)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。
  • 当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法—句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。

  神经网络

  • 神经网络是受人脑组织的生理学启发而创立的。
  • 由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。
  • 增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。
  • 神经网络可以实现监督和非监督学习条件下的分类。

4、模式识别系统和实例

模式识别系统

     模式识别系统的基本构成

            

    模式识别系统组成单元

  • 数据获取:用计算机可以运算的符号来表示所研究的对像
             ——二维图像:文字、指纹、地图、照片等
             ——一维波形:脑电图、心电图、季节震动波形等
             ——%E�%Q9�E7��参量和逻辑值:体温、化验数据、参量正常与否的描述
  • 预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原。
  • 特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征
             ——测量空间:原始数据组成的空间
             ——特征空间:分类识别赖以进行的空间
             ——模式表示:维数较高的测量空间“—>维数较低的特征空间
  • 分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别
            ——基本做法:在样本训练基础上确定某个判别规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。

 模式识别过程实例

  • 在传送带上用光学传感器件对鱼按品种分类
              

  识别过程

  • 数据获取:架设一个摄像机,采集一些样本图像,获取样本数据
  • 预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开
  • 特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量——长度、亮度、宽度、鱼翅的数量和形状、嘴的位置,等等
  • 分类决策:把特征送入决策分类器

  模式分类器的获取和评测过程

  • 数据采集
  • 特征选取
  • 模型选择
  • 训练和测试
  • 计算结果和复杂度分析,反馈

  训练和测试

  • 训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。
  • 测试集:在设计识别和分类系统时没有用过的独立样本集。
  • 系统评价原则:为了更好地对模式识别系统性能进行评价,必须使用一组独立于训练集的测试集对系统进行测试。

5、相关数学概念分布

随机向量及其分布

——随机向量

  • 如果一个对象的特征观察值为{x1,x2,...,xn},它可构成一个n维的特征向量值X,即
             x={x1,x2,...,xn}T
             式中,x1,x2,...,xn为特征向量x的各个分量。
  • 一个特征可以看作n维空间中的向量或点,此空间称为模式的特征空间Rn。
  • 在模式识别过程中,要对许多具体对象进行测量,以获得许多次观测值。
  • 每次观测值不一定相同,所以对许多对象而言,各个特征分量都是随机变量;即许多对象的特征向量在n维空间中呈随机性分布,成为随机向量。

——随机向量的参数

  • 数学期望(均值)和方差
  • 协方差矩阵
  • [例:求随机变量的数学期望和协方差矩阵]
  • 正态分布
             ——一维正态密度函数



本门课程主要内容

第一章 概论
第二章 聚类分析
第三章 判别函数
第四章 统计判别
第四章 特征选择和提取
第五章 神经网络
第六章 句法模式识别
第七章 模糊模式识别
第八章 模式识别应用



  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
模式识别得到了迅速发展, 并取得了丰富的理论成果, 其应用领域也己扩展到了文本分类、 语音识别、 图像识别、 视频识别、信息检索与数据挖掘等领域. 由于模式识别理论具有重要的学术价值和广泛的应用领 域 因而越来越多的人认识到模式识别课程的重要性, 相关领域的科研工作者也投入了很高的学习热情. 为了给在校本科生和 研究生提供一本内容较新、论述较系统的有关模式识别的教材, 也为了给相关领域的科研人员提供一本内容涵盖面广、 具有一定前沿性和实用性的参考书, 我们编写了这本书. 本书以基础理论教学为主, 同时穿插实际应用来加深对基础理论的理解. 在撰写过程中遵循以下原则:在结构安排上尽量使知识表达体系与学科本身的体系 丰目一致;在内容阐述方式上遵循人的认知规律;在选材上尽量满足读者掌握基础的学科知识. 书中不断引入和介绍学科最新的成果, 增加模式识别在语音识别、 信息检索等领域的应用. 本书具有以下特点. (1)内容广泛:本书系统阐述模式识别领域的基础知识及经典方法, 对经实践证明具有重要现实意义的新理论、 新方法、 新技术也进行介绍. 包括统计模式识 别、 句法模式识别、 模糊模式识别、 神经网络技术和统计语言模型与信息检索模 型,以及目前应用广泛的机器学习模型:隐马尔可夫模型(HMM)、最大’脑模型(ME) 和条件随机场模型(C盯s)等. (勾结构清晰合理:本书内容以学习目标、内容讲解、小结、习题与问题思考、 参考文献为主线,按由浅入深、先易后难、先理论后应用、先传统后前沿来安排, 有益于读者对各种理论、 方法的理解. (3)选材考究精细:模式识别理论、 方法、 技术纷繁众多, 而且新的理论和方 法还在不断地产生. 本书在众多的知识中选取基础理论、 经典学习方法、 典型应 用等重要内容. (4)注重基础:打好基础是教育经验的总结, 也是科技高速发展的需要,本 书自始至终都非常注重强化基本概念、基本思想、基础理论、基本方法和基本 技能. (5)注重实践与应用:本书专门安排 4 章内容介绍模式识别的典型应用及实现 过程, 结合实例讲述模式识别的理论与方法, 从而对读者理解模式识别理论与方 法有很好的指导作用.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值