篇章分析的理论和应用
一、篇章分析的理论
- 衔接性分析
-
衔接性:篇章范围内词汇之间的关联。 一个成分的含义依赖于另一成分的解释
-
连贯性:句子层⾯面的意义关联
篇章的衔接性可以分成两类,前者是借助一系列的语法手段,⽽而后者是词汇手段:
- 语用学
主要研究人们如何运用语言:
-如何使用语言达成某种目的?——言外行为
-会话含义如何根据话语推导?—合作原则
言外行为理论
合作原则
- 对话分析
对话分析vs语用学
对话分析关注对话过程中的⼀一连串话语之间的关系
二、篇章分析在中文信息处理中
-
有歧义的句子如何理解?“能穿多少,穿多少?”
1)在自然语言处理理中,篇章分析被认为是有衔接性和连贯性两个方面,前者目前研究主要集中在词汇链和指代消解;后者的研究主要关注意图
2)目前主要还是通过标注语料库来进行行机器学习训练机器
3)语用学和对话分析不是研究的主要兴趣 -
中文的处理难点
1)汉语本身的难题:
a. 篇章的基本单位是什么?零句?小句?标点句?
b. 汉语中零形指代使用普遍
2)目前没有⼀一个完善的汉语篇章模型
三、读后感
Li Mian:
机器在进行语篇分析时,要想正确理解语篇含义,需要先识别语篇中起衔接作用的词汇性成分。语篇中起衔接作用的常常为连词、副词、代词、名词等。代词、名词一般表示的是指称义,要进行同指或指代的消解。而连词和副词在上下文中表示的是词义,需要先消除歧义,并进行词义的相似性计算。如何让机器