句法模式识别/结构模式识别(二)---形式语言


相关文章:
句法模式识别/结构模式识别(一)—概述
句法模式识别/结构模式识别(三)—文法推断
句法模式识别/结构模式识别(四)—句法分析
句法模式识别/结构模式识别(五)—自动机


句法模式识别的理论基础是乔姆斯基提出的形式语言,这篇博客就简单讲讲什么是形式语言

一、基本概念

  1. 字母表:与所研究的问题有关的符号的有限集合,用V或 ∑ \sum{} 表示,例: V 1 = { A , B , C , ⋯ Z }    V 3 = { 0 , 1 , 2 } \boldsymbol{V}_1=\left\{ \boldsymbol{A},\boldsymbol{B},\boldsymbol{C},\cdots \boldsymbol{Z} \right\} \,\, \boldsymbol{V}_3=\left\{ 0,1,2 \right\} V1={A,B,C,Z}V3={0,1,2}

  2. 句子(链):由字母表中符号组成的有限长度的符号串,空句用 λ \boldsymbol{\lambda } λ表示

  3. 句子(链)的长度:句子中所包含的符号的数目,用 ∣ ⋅ ∣ \left| \cdot \right| 表示
    例:由V={a,b,c}中元素可组成的句子:
    abc,aacc,。。。等 。 所以 ∣ a 3 b 3 c 3 ∣ = 9 \left| \boldsymbol{a}^3\boldsymbol{b}^3\boldsymbol{c}^3 \right|=9 a3b3c3=9(上标3代表着重写次数)

  4. 文法:在一种语言中,构成句子所必须遵循的规则的集合,用G表示。
    G = ( V N , V T , P , S ) \boldsymbol{G}=\text{(}\boldsymbol{V}_{\boldsymbol{N}},\boldsymbol{V}_{\boldsymbol{T}},\boldsymbol{P},\boldsymbol{S}\text{)} G=VN,VT,P,S
    这其中:
    V N \boldsymbol{V}_{\boldsymbol{N}} VN:非终止符的有限集,子模式的集合,大写字母表示(有点类似数据结构中树结构中除了叶子结点外的其他节点,不知道根节点算不算,不过这也不重要)
    V T \boldsymbol{V}_{\boldsymbol{T}} VT:终止符的有限集,基元的集合,小写字母表示(有点类似数据结构中树结构中的叶子结点)
    P:代表生成式的有限集,用文法产生句子时的重写规则
    在这里插入图片描述
    S:起始符,代表模式本身,是一个特殊的非终止符,用生成式构成句子的时候,必须由左边是S的生成式开始

  5. 语言:由字母表中的符号根据某种文法组成的句子的集合,用L表示
    V ∗ \boldsymbol{V}^* V:V中符号组成的所有句子的集合,包括空句
    V + \boldsymbol{V}^+ V+:不包含空句的句子集合, V ∗ = V + + { λ } \boldsymbol{V}^*=\boldsymbol{V}^++\left\{ \boldsymbol{\lambda } \right\} V=V++{λ}
    在这里插入图片描述在这里插入图片描述

二、文法分类

四种类型:0型文法、1型文法、2型文法、3型文法

设有文法 G = ( V N , V T , P , S ) \boldsymbol{G}=\text{(}\boldsymbol{V}_{\boldsymbol{N}},\boldsymbol{V}_{\boldsymbol{T}},\boldsymbol{P},\boldsymbol{S}\text{)} G=VN,VT,P,S
其中:
V N \boldsymbol{V}_{\boldsymbol{N}} VN:非终止符,用大写字母表示
V T \boldsymbol{V}_{\boldsymbol{T}} VT:终止符,用小写字母表示
P:产生式
S:起始符

0型文法(无约束文法)

P : α → β \boldsymbol{P}\text{:}\boldsymbol{\alpha }\rightarrow \boldsymbol{\beta } Pαβ
其中, α ∈ V + , β ∈ V ∗ \boldsymbol{\alpha }\in \boldsymbol{V}^+\text{,}\boldsymbol{\beta }\in \boldsymbol{V}^* αV+βV

在这里插入图片描述

1型文法(上下文有关文法)

P : α 1 A α 2 → α 1 β α 2 \boldsymbol{P}: \boldsymbol{\alpha }_1\boldsymbol{A\alpha }_2\rightarrow \boldsymbol{\alpha }_1\boldsymbol{\beta \alpha }_2 P:α1Aα2α1βα2
其中, α 1 \boldsymbol{\alpha }_1 α1 α 2 \boldsymbol{\alpha }_2 α2称为A的上下文, α 1 , α 2 ∈ V ∗ ; β ∈ V + , A ∈ V N ∗ \boldsymbol{\alpha }_1\text{,}\boldsymbol{\alpha }_2\in \boldsymbol{V}^*\text{;}\boldsymbol{\beta }\in \boldsymbol{V}^+\text{,}\boldsymbol{A}\in \boldsymbol{V}_{\boldsymbol{N}}^{*} α1α2VβV+AVN(指 V N \boldsymbol{V}_{\boldsymbol{N}} VN的元及其组成的串)
由上下文有关文法构成的语言称为上下文有关语言,用 L ( G 1 ) \boldsymbol{L}\left( \boldsymbol{G}_1 \right) L(G1)表示, G 1 \boldsymbol{G}_1 G1:上下文有关文法

含义:只有处于 α 1 \boldsymbol{\alpha }_1 α1 α 2 \boldsymbol{\alpha }_2 α2之间的非终止符或非终止串才能被 β \boldsymbol{\beta } β替换,并且代换后的符号数目要大于等于代换前的数目

在这里插入图片描述

2型文法(上下文无关文法)

P : A → β \boldsymbol{P}: \boldsymbol{A}\rightarrow \boldsymbol{\beta } P:Aβ
其中 A ∈ V N , β ∈ V + \boldsymbol{A}\in \boldsymbol{V}_{\boldsymbol{N}}, \boldsymbol{\beta }\in \boldsymbol{V}^+ AVN,βV+

在这里插入图片描述在这里插入图片描述

3型文法(正则文法、有限态文法)

P : A → a B    或 A → b \boldsymbol{P}: \boldsymbol{A}\rightarrow \boldsymbol{aB}\,\,\text{或}\boldsymbol{A}\rightarrow \boldsymbol{b} P:AaBAb
其中, A , B ∈ V N , a , b ∈ V T \boldsymbol{A},\boldsymbol{B}\in \boldsymbol{V}_{\boldsymbol{N}}\text{,} \boldsymbol{a},\boldsymbol{b}\in \boldsymbol{V}_{\boldsymbol{T}} A,BVNa,bVT

在这里插入图片描述在这里插入图片描述后一种文法的限制比前一种文法的限制严格;
限制越多的文法越容易推断;
句法模式识别中多采用上下文无关文法和正则文法

三、模式的描述方法

根据结构特征对模式进行描述。—叫做结构描述法(又称句法表示法)
模式的表示:链表示法、树表示法、图表示法
对应的文法:链文法(串文法)、树文法、图文法

基元的确定

目前关于基元的确定还没有一个通用的解决办法,更多是依赖经验,基元的选择遵循两个基本原则:

  1. 基元应是模式的基本单元,能够通过一定的结构关系对数据进行紧凑、方便的描述。
  2. 基元应该容易用现有的非句法方法进行提取或识别。例如语音识别中—音素;识别手写文字—笔划

模式的链表示法

1、链码法
在这里插入图片描述在这里插入图片描述
2、图形描述语言法(PDL)
在这里插入图片描述在这里插入图片描述链表示法:只能从左边或右边与其他符号相连,是一维连接方式

模式的树表示法

是一个高维表示法
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值