《Speech and Language Processing》读书笔记——语法规则及其解析

本文详细介绍了《Speech and Language Processing》中关于PCFG(概率上下文无关语法)的概念,包括其基本原理、probabilistic CKY算法、存在的问题及改进方法,同时探讨了语法剖析树的评价标准。
摘要由CSDN通过智能技术生成

《Speech and Language Processing》读书笔记——语法规则及其解析

1.摘要

本章主要介绍了:

  • PCFG(概率上下文无关语法)
  • probabilistic CKY(基于概率上下文无关语法的CKY算法)
  • PCFG存在的问题
  • PCFG的改进
  • Probabilistic lexicalized CFGs(词汇化上下文无关语法)
  • 语法剖析树的评价标准

2.PCFG

其基本原理就是,结合上下文无关文法(CFG)中最左派生规则(left-most derivations)和不同的Rules概率,计算所有可能的树结构的概率,取最大值对应的树作为该句子的句法分析结果。
对于 PCFG 中的 CFG 部分, 一般是由领域相关的专家给出的, 例如英语专家规定英语的 CFG. 而PCFG 中的 p 是从语料中统计而来. 运用最大似然估计, 可以有:
    P ( X − > Y ) = c o u n t ( X − > Y ) / c o u n t ( X ) P(X -> Y) = count(X->Y)/count(X) P(X>Y)=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值