句法分析

最新推荐文章于 2021-08-20 08:52:08 发布

xlm289348

最新推荐文章于 2021-08-20 08:52:08 发布

阅读量1.1k

点赞数

分类专栏：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xlm289348/article/details/8523611

版权

自然语言处理专栏收录该内容

8 篇文章 0 订阅

订阅专栏

自顶向下的分析是从树根开始推导的；

S->z1->z2->...->zn

所用到的规则放在一个后进先出的堆栈里，开始时堆栈为空，这个堆栈的作用是记录最近所用到的规则；

堆栈的作用是记录最近所用到的规则；

假定左部符号为A的规则的排列顺序是Pa.1,Pa.2,...,算法如下:

局部分析表：

序号：标明是整个分析过程中的第几个据不分析；

根：标明该局部分析过程的树根；

起点：标明该局部分析是从输入串的第几个词开始；

终点：标明局部分析是到输入串的第几个词结束；

成分表：标明该局部分析是以哪些局部分析为其构成成分的；

概率与法：

句法歧义：从自动分析的角度看，这些歧义可分为：外显式和内含式两种：如果一个词串所对应的若干种结构有各不相同的根，叫做外显式歧义；

如果一个词语串所对应的若干种结构有形同的根，叫做内含式歧义；

乔姆斯基范式：

A->a;

A->BC

Ai,j(A)=P(A->a)

一般化：

规则概率的调整，需要用到外部概率的概念；

先来考虑A是整个语句绑定后的符号（或者从生成的观点看，是由A推出整个语句）

乔姆斯基范式：

句法分析二：

1 线图分析算法（ Chartparsing ）

2 标准 LR 分析算法

3 GLR 分析算法（ Tomita/ 富田胜算法）

Chart算法的过程描述：

1) 将待分析字符串 w 置入输入缓冲区， agenda 清为空栈；

2) 循环，反复执行下面步骤，直至输入缓冲区和 agenda 均为空

a) 若 agenda 为空，则从输入缓冲区取一个字符，并把该字符及其起止位置
(P1, P2) 推入 agenda 栈；

b) 从 agenda 中弹出栈顶的边，该边的起止位置为 (P1, P2), 边上标记为 L ；

c) 检查规则集中的规则，对所有形如 A à L b 这样的规则，在 active arc 集合中增加一条起止位置为 P1, P2 ，弧上为 A à L · b 这样的点规则；

d) 把从 agenda 中弹出的标记为 L 的边，加入到 chart 中的 P1, P2 之间；

e) 检查所有 active arc ，如果存在起止位置为 P0, P1 ，且弧上点规则为 A-> a · L b 的 active arc ，就增加一条新的 active arc ，起止位置为 P0, P2 ，弧上点规则为
A-〉 a L · b

f)如果一条 active arc （起止位置为 P0, P2 ）上点规则形如 A-> a L · （点号在规则最右端），就将起止位置为 P0, P2 ，边上标记为 A 的边压入 agenda 栈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。