【ChatBot学习笔记】6.基于统计的句法分析树

本文解析了句法分析树在句子成分识别和依存关系确定中的作用,通过PCFG方法和实例说明其构造原理,包括终结符、非终结符和规则集的概念。讨论了上下文无关法如何生成可能的句子组合,以及产生的局限性,如部分不流畅语义的出现。
摘要由CSDN通过智能技术生成

6.基于统计的句法分析树

句法分析树有什么用?
  1. 分析句子成分
  2. 确定单词间的依存关系

简单来说,依存分析/句法分析是句子分析的方法论或者文字层面的分析;句法分析树是句法分析的实践,从数学/编程层面进行

构造句法分析树,最常用的是上下文无关法(PCFG),这个方法有三个关键词:
  • 终结符集合:就是所有的叶节点,不可再分的词,如名词、动词、量词
  • 非终结符集合:所有非叶节点。递归定义:非终结符=终结符+非终结符,可再分,如动宾、主谓宾、整个句子
  • 规则集:(非)终结符集对应的概率

一个解释性例子:

产生式:

Sent -> S V O
S -> 人 | 天
V -> 吃 | 下
O -> 雨 | 雪 | 饭 | 肉

SVO代表了主谓宾的组成形式,那就有最多2 * 2 * 4 = 16种组合,上下文无关法允许这些组合出现,也就是在生成阶段只考虑词性,不考虑词义

列举一些例子:{人吃饭、人吃肉、天下雨,天吃饭}

看到了吗,部分语义不畅的例子也被生成了

句法分析树的一个更简单的例子:

终结符集合:∑={我, 吃, 肉}

非终结符集合:N={S, VP, ……}

规则集:R={

NN->我 0.5

Vt->吃 1.0

NN->肉 0.5

VP->Vt NN 1.0

S->NN VP 1.0

}
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值