NLP学习记录——句法分析

句法分析

一般而言,句法分析分为两个主要的方向:
一是句法结构分析,或称成分句法分析、短语句法分析,亦即context-free grammers(CFGs),将语句视为嵌套的短语组合:
Basic unit: words
the, cat, cuddly, by, door
det, N, Adj, P, N
Words combine into phrases
the cuddly cat, by the door
NP -> Det Adj N,PP -> P NP
Phrases can combine into bigger phrases
the cuddly cat by the door
NP -> NP PP
使用语法树表示更为方便:
这里写图片描述
一是依存分析,研究单词之间的依赖关系:
这里写图片描述
同样,依存关系也适于用树来表达:
这里写图片描述
首先来看看CFGs。

CFGs

CFGs的定义包括四个集合:
N:有限的非终端语法标识的集合,亦即语法树上非叶子结点的集合。
S:起始标识
E:有限的终端标识集合,也是语句中所有单词的集合,位于句法树的叶子结点。但是要注意,句法树的叶子节点允许为空。
R:构建句法树的有限个规则的集合,表述了句法树的构建过程。
即G=(N,E,S,R)
例:
这里写图片描述
基于以上集合可构建句法树:
这里写图片描述
但是,构建过程也可能会有歧义:
这里写图片描述
left-most derivation是句法树构建过程中的一串序列,例:
s1=S
s2=NP VP.(基于规则s->NP VP)
s3=DT NN VP(nP->DT NN)
s4=the NN VP(DT->the)
s5=the man VP(NN->man)
s6=the man Vi(VP->Vi)
s7=the

  • 6
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
自然语言处理中的句法分析(Parsing)是指对自然语言文本进行语法分析,以确定其句法结构。句法分析是自然语言处理中的重要技术之一,其主要内容包括: 1. 词法分析:将文本中的单词和符号按照词法规则进行分类和标记,以便后续进行句法分析。 2. 语法分析:分析文本的语法结构,确定文本中的短语和句子的成分关系,如主语、谓语、宾语、定语、状语等。 3. 句法树构建:将分析结果以树形结构表示,便于后续进行语义分析和自然语言生成。 4. 依存关系分析:将文本中的词语按照依存关系进行连接,形成依存关系图,表示句子中各个成分之间的依存关系。 5. 语言模型:通过统计语言学方法对句子的结构进行建模,以便进行语法分析和自然语言生成。 6. 句法规则:定义和应用语法规则,以便进行句法分析和自然语言理解。 在句法分析中,有两种常见的方法:基于规则的句法分析和基于统计机器学习句法分析。基于规则的句法分析使用语法规则进行分析,通常需要人工编写规则,如上下文无关文法(Context-Free Grammar)和依存文法(Dependency Grammar)等。基于统计机器学习句法分析使用统计模型进行分析,通常需要大量标注数据进行模型训练,如隐马尔可夫模型(Hidden Markov Model)和条件随机场(Conditional Random Fields)等。 句法分析在自然语言处理中有着广泛的应用,如机器翻译、问答系统、自然语言生成等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值