NLP基础知识(二)

在这里插入图片描述
谓语论元

 谓语动词决定了一个分句的基本格局,谓语动词一旦确定,整个分句的基本格局也就确定下来了。
谓语动词需要一个、两个或三个名词性结构(这个结构可能是短语层面的,也可能是分句层面的)与其结合来表达完整的意思,有人称这个是动词的论元结构,也就是一个动词可以有一个、两个或是三个论元。
谓语动词基本上表达了分句的主要含义,我们在进行表达时最先想到的应该就是动词部分,我们只要确定了谓语动词,然后再根据表意需要确定其论元就比较容易了。
语义角色标注 (Semantic Role Labeling, SRL) 是一种浅层的语义分析技术,标注句子中某些短语为给定谓词的论元 (语义角色) ,如施事、受事、时间和地点等。其能够对问答系统、信息抽取和机器翻译等应用产生推动作用。 仍然是上面的例子,语义角色标注的结果为: 

在这里插入图片描述
其中有三个谓词“提出”、“调研”和“探索”。
以“探索”为例,积极是它的方式(一般用ADV表示),而新机制则是它的受事(一般用A1表示)
核心的语义角色为 A0-5 六种: A0 通常表示动作的施事, A1通常表示动作的影响等, A2-5 根据谓语动词不同会有不同的语义含义。
其余的15种语义角色为附加语义角色,如LOC 表示地点,TMP 表示时间等。附加语义角色列表如下:
在这里插入图片描述
在这里插入图片描述
语义依存分析 (Semantic Dependency Parsing, SDP),分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。
使用语义依存刻画句子语义,好处在于不需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。
语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。
例如以下三个句子,用不同的表达方式表达了同一个语义信息,即张三实施了一个吃的动作,吃的动作是对苹果实施的。
在这里插入图片描述
语义依存关系分为三类,分别是:1.主要语义角色,每一种语义角色对应存在一个嵌套关系和反关系;2.事件关系,描述两个事件间的关系;3.语义依附标记,标记说话者语气等依附性信息。(大约70种关系)
在这里插入图片描述
在这里插入图片描述
语义依存分析不受句法结构的影响,将具有直接语义关联的语言单元直接连接依存弧并标记上相应的语义关系。这也是语义依存分析与句法依存分析的重要区别。
在这里插入图片描述
从上边的对比可以看出:
虽然三个句子拥有不同的句子结构, 产生了不同的句法分析结果, 但是三个句子中语言单元之间的语义关系并没有发生变化, 从"吃"这个词来看, 它的主体, 客体…都没有发生变化.
在这里插入图片描述
两者依存弧上标记的语义关系完全不同,语义依存关系是由论元关系引申归纳而来,可以用于回答问题,如我在哪里喝汤(loc),我在用什么喝汤,谁在喝汤,我在喝什么。但是句法依存却没有这个能力。
语义依存与语义角色标注之间也存在关联:
1. 语义角色标注只关注句子主要谓词的论元及谓词与论元之间的关系;
2. 语义依存不仅关注谓词与论元的关系,还关注谓词与谓词之间、论元与论元之间、论元内部的语义关系。
3. 语义依存对句子语义信息的刻画更加完整全面。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
篇章分析的最终目标是从整体上理解篇章,有助于深度解析语言,提高机器理解语义的能力。
最重要的任务是分析篇章结构。篇章结构包括:语义结构,话题结构,指代结构等。
篇章不是语言成分的无序堆砌,而是一个有组织的、层级性的整体。
例句1:今天天气非常人。科恩来自于德国。统计自然语言处理近几年来得到了快速发展。
例句2:老王工作非常勤奋,每天早出晚归。他常常会提前半个小时到办公室,[ ]晚上九点后才回家,[ ]中午也很少休息。

篇章有7个基本特征:衔接性,连续性,意图性,信息性,可接受性,情景性和跨篇章性。其中衔接性,连续性,意图性和信息性对自然语言产生了很多影响。
衔接和连贯常常以表层形式体现,为篇章分析提供了‘形式标记’。篇章中各语段或句子之间在形式上是衔接的、在语义上是连贯的。
信息性和意图性属于篇章语义层面上的特征,隐藏在篇章更深的层次上,通常会融合在连贯性中考虑。
在这里插入图片描述
目前关于语篇衔接性的研究仅停留在指代消歧或词汇链构建方法本身的研究上,并没有上升到通过指代消歧和词汇链分析实现对语篇衔接性的分析。汉语的相关研究都属于跟进行研究。
无论是外语或者汉语,篇章的衔接和连贯性都是最需要关注的两个问题,是篇章的最基本特征。目前的研究主要集中在这两个方面。
在这里插入图片描述
早在20世纪70年代,语言学家和认知科学家就对篇章分析理论开展了研究。
言语行为理论,1962
中心理论,1986
修辞结构理论,1987
脉络理论,1998
篇章表示理论,1988
分段式语篇表示理论,1993
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
篇章分析:
至今未出现一个有重大突破的篇章语言模型;
中文方面都属于跟进型研究;
理论先于方法,方法先于落地。

©️2020 CSDN 皮肤主题: 1024 设计师:上身试试 返回首页