Coursera自然语言处理 Week4 笔记

最新推荐文章于 2024-07-02 10:51:28 发布

LVB10101111

最新推荐文章于 2024-07-02 10:51:28 发布

阅读量641

点赞数

分类专栏：自然语言处理Coursera By M. Collins 文章标签：自然语言处理 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013515273/article/details/78273342

版权

自然语言处理Coursera By M. Collins 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

前一周讲的Pure PCFG是完全和语义没有关系的，但是很多的“歧义问题”放在一个特定的语境中，就不会产生歧义的，所以这个语义还是很重要的。第四周就讲了如何把这种语义放进Pure PCFG中去。

1. Pure PCFG的缺点

看下面这个例子：

这棵Parsing Tree由7条规则组成，看其中的第5条规则“NNP $\to$ IBM”，这条规则的确定与句子中其他的单词无关，与整棵树的其余部分也无关，只与 $P(NNP \to IBM)$ 的大小有关。而实际上，IBM这个单词的词性究竟是不是NNP，与句子中其余单词是有关系的。

再比如说下面这个例子中：

唯一不一样的地方就是选择” $VP \to VP \ PP$ ”还是” $NP \to NP \ PP$ ”，在pure PCFG中，会选择概率大的那条规则。但是实际上，选择哪一条规则可以直接从其他单词中看出，” $VP \to VP \ PP$ ”才是正确的选择。

总结：lexical information（语义信息）是重要的，我们大家需要它！

2. Lexical PCFG理论

Lexical PCFG通过向规则中加入“head”来添加语义信息。

“head”的意思就是这个词组中最重要的部分，如果只有一个单词，那就是这个单词本身，比如说：

$DT \to the$ 中的词组就是”the”，则“head”就是“the”，于是标记为 $DT(the) \to the$

$NN \to witness$ 中词组就是”witness”，则“head”就是“witness”，于是标记为 $NN(witness) \to witness$

$NP \to DT(the) \ NN(witness)$ 中的词组是“the witness”，那么“head”就是“witness”，于是标记成 $NP(witness) \to DT(the) \ \overline{NN}(witness)$ ；选择哪个孩子作为head，就在它的上面标个横线。

就这样，由下至上，反向传播上去，直到root处结束。

于是就有了下面这个Pure PCFG 和 Lexical PCFG的对比图：

2.1 模型搭建

于是，我们的模型搭建如下：

t = arg max t \in  () P (t)

$t = \mathop \arg \max_{t \in \mathcal{T(S)}}P(t)$

P (t) = γ (r o o t) \times \prod i = 1 N q (r i)

$P(t) = \gamma(root) \times \prod_{i=1}^{N}q(r_i)$

比如在上面的这棵树中，有8条rules和一个root： $S(questioned)$

于是整棵树的概率计算如下：

2.2 参数估计

于是，这个模型的唯一参数就是 $q(r_i)$ ，因为加入了lexical information，这里的参数估计与Pure PCFG也不同了。

令 $X$ 为规则左边的部分， $H$ 为head单词的index， $R$ 表示这条规则 $X(H) \to Y(H) \ Z(M)$ ， $M$ 为词组中不是head的单词index。

于是有:

q (X (H) \to Y (H) Z (M)) = q (R, M | X, H) = q (R | X, H) q (M | R, X, H)

$q(X(H) \to Y(H) \ Z(M)) = q(R,M|X,H)=q(R|X,H)q(M|R,X,H)$

于是这个参数转变成了两个小参数 $q(R|X,H)$ 和 $q(M|R,X,H)$

然后， $q(R|X,H)$ 如下计算：

q (R | X, H) = λ 1 \times q (R | X, H) + (1 - λ 1) \times q (R | X)

$q(R|X,H)=\lambda_1\times q(R|X,H)+(1-\lambda_1) \times q(R|X)$

其中，

q (R | X, H) = C o u n t ( R , X , H ) C o u n t ( X , H )

$q(R|X,H) = \frac{Count(R, X, H)}{Count(X, H)}$

q (R | X) = C o u n t ( R , X ) C o u n t ( X )

$q(R|X) = \frac{Count(R, X)}{Count(X)}$

$q(M|R,X,H)$ 如下计算：

q (M | R, X, H) = λ 2 \times q (M | R, H) + (1 - λ 2) \times q (M | R)

$q(M|R,X,H)=\lambda_2 \times q(M|R,H)+(1-\lambda_2) \times q(M|R)$

其中，

q (M | R, H) = C o u n t ( M , R , H ) C o u n t ( R , H )

$q(M|R,H) = \frac{Count(M,R,H)}{Count(R,H)}$

q (M | R) = C o u n t ( M , R ) C o u n t ( R )

$q(M|R) = \frac{Count(M,R)}{Count(R)}$

可以看到，这里参数估计的时候，融合了non-lexical部分（ $q(R|X)$ 和 $q(M|R)$ ）和lexical部分（ $q(R|X,H)$ 和 $q(M|R,H)$ ），并且通过 $\lambda_1$ 和 $\lambda_2$ 来权衡这两部分。

3. Lexical PCFG实现

这里依旧是使用“动态规划”来实现，唯一不通的就是，参数的计算，除此之外，整个算法没有什么不同。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Coursera自然语言处理 Week4 笔记

Lexical PCFG
复制链接

扫一扫

专栏目录

LVB10101111 CSDN认证博客专家 CSDN认证企业博客

码龄10年

53: 原创

24万+: 周排名

83万+: 总排名

4万+: 访问

: 等级

957: 积分

52: 粉丝

19: 获赞

15: 评论

39: 收藏

私信

关注

热门文章

分类专栏

最新评论

Mac OS环境下的libsvm在Matlab中安装
pumpkinlampx: 请问已经可以得到最后一步Accuracy，但在用libsvmtrain函数时还是报错Undefined function or variable 'libsvmtrain'怎么办呀
Mac OS环境下的libsvm在Matlab中安装
m0_58024416: 参照教程成功安装，给博主大大的赞
Mac OS环境下的libsvm在Matlab中安装
qq_43006393: make了libsvmread.c和libsvmwrite.c，但是没有make svmtrain.c和svmpredict.c两个文件，这个要怎么解决呢？
Mac OS环境下的libsvm在Matlab中安装
ScienceLight: 4.2步骤中还是失败了，请问还有解决方法吗 mex -setup Error using mex No supported compiler or SDK was found. For options, visit http://www.mathworks.com/support/compilers/R2016b/maci64.html.
Mac OS环境下的libsvm在Matlab中安装
皮皮管理回复 ZhouRui_csu: 你直接把 libsvm-3.24 文件夹添加到 toolbox 后，matlab 的 set path 选择第 2 个按钮【添加并包含子文件夹】再选中libsvm-3.24 就行，这个文件夹下所有的文件都会被加入到搜索路径里

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。