10.篇章分析

文章探讨了篇章的七个基本特征,如衔接性、连贯性、意图性和信息性,介绍了早期的脚本理论及其在信息抽取中的应用。同时,着重讨论了汉语篇章研究中的挑战,如实体和事件指代消歧以及衔接与连贯性分析的理论与模型构建。
摘要由CSDN通过智能技术生成

Beaugrande and Dressler(1981)认为篇章具有衔接性(cohesion)、连贯性(coherence)、意图性(intentionality)、信息性(informativity)、可接受性(acceptability)、情景性(situationality)和跨篇章性(intertextuality)等 7个基本特征。其中,接性、连贯性意图性和信息性这四个基本特征对自然语言处理产生了深远的影响

早在20世纪 70年代,语言学家和认知科学家就对篇章分析理论开展了研究Schank and Abelson(1977)首先提出了著名的概念依存(concept dependency)理论,并在此基础上提出了脚本(script)方法,对特定的“故事”进行理解。脚本方法是一种动态的记忆模式,将人们在日常生活中的典型场景框架化。例如,去餐馆就餐时,其活动次序可以描述成以下框架(即脚本):进餐馆、入座、看菜单、点菜、用餐、付账、离开等。这样,篇章分析就简化成将篇章中的相应信息提取出来,再填入框架中的相应信息槽(slot)。其实,目前备受关注的信息抽取研究就采取类似的思想,只是简化了抽取的内容。当然,脚本方法过于依赖领域:当场景发生变化时,需要构建新的脚本。此外,很多篇章很难用特定的场景来描述,这就在很大程度上限制了脚本方法的推广使用。

10.3 篇章衔接性研究

衔接又称为外部联结,主要表现为整个篇章范围内词汇(或短语)之间的关联,指篇章中存在于表层结构上的各语言成分之间的语法或语义关系。当语篇中一个成分的含义依赖于另一个成分的解释时,便产生衔接关系。
Halliday and Hasan(1980)将衔接分为五种情况;一般指代(reference)、替按(substitution)省略(ellipsis)、连接(conjunction)和词汇衔接(lexicalcohesion)。其中一般指代用代词、定冠词(指英语中)等来表示特定的事和物;替换通过异形同义词表示接;省略(汉语中也称“零指代”)特指指代词缺省的情况;连接指在篇章中通过连接词、副词或短语词组实现某种连接关系;词汇衔接是指篇章中部分词汇相互之间存在的语义的联系或重复,或由其他词语替代,或共同出现,主要通过重复、同义词或近义词、上下文关系词、局部整体关系词和反义词或者词搭配来连接上下文。

10.4 篇章连贯性研究

与衔接性不同连贯性主要通过句子(或群)之间的语义关联来表示篇章不同部分之间的关联关系。连贯又称为内部联结,正是有了内部连接,才使得篇章具有整体性。目前在自然语言处理中对于篇章连贯性的研究主要针对信息性和意图性两方面展开。

10.6 关于汉语的篇章研究

另外,在已有工作的基础上,如何进一步开展实体指代和事件指代的消歧研究,并建立汉语篇章的衔接性和连贯性分析理论以及实现模型和方法等,这一系列问题都是汉语篇章分析研究面临的巨大挑战,任重而道远。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值