【代数语言学巡礼】Lambda-演算在形式语义学的中应用I

最新推荐文章于 2021-01-12 12:28:34 发布

hanss2

最新推荐文章于 2021-01-12 12:28:34 发布

阅读量956

点赞数 3

分类专栏：代数

本文链接：https://blog.csdn.net/hanss2/article/details/110355309

版权

代数专栏收录该内容

20 篇文章 11 订阅

订阅专栏

【代数语言学巡礼】Lambda-演算在形式语义学的中应用I

代数语言学又称做形式语言学,其基础思想是建立语言的数学模型,如美国逻辑学家、语言学家N.乔姆斯基、苏联数学家О.С.库拉金娜、语言学家Y.巴尔-希列尔分别提出了语言的生成性模型、分析性模型和辨识性模型.

形式语义学与组合原则

自Chomsky创立生成语法(generative grammar)以来，人们开始普遍承认语法是可以按组合原则逐步生成的。生成语法的一个基本出发点是: 自然语言中存在无穷多的句子，同时大脑的功能是有限的, 所以我们的语言能力必须包含某种可以描述这些无穷多句子类型的有穷机制。也就是说，通过这些有穷的机制，我们可以不断地对已有的元素进行组合，并生成无穷多的句子或语法类型。因此，可以用形式化的方法分析句子的语法及其生成过程。

但是，在很长一段时间里，Chomsky反对把组合原则和形式化方法应用到语义学的研究中。这是因为语义问题不像语法结构那样有比较清楚的结构，尤其是，很难有与语法相对应的组合生成的语义解释。然而，组合原则对于形式语义学是至关重要的，如果不能在自然语言的语义研究中很好地贯彻组合原则，那么也就没有形式语义学这一研究领域。这成为形式语义学发展的一个瓶颈。Chomsky对形式语义学基本持怀疑态度。在很长的时间里，MIT一直没有研究形式语义学的人，直到 1989 年Chomsky才聘请了 Irene Heim 去MIT工作。这时的形式语义学已经发展得比较成熟。

形式语义学的想法是，对应于语法中的组合原则，语义解释也应该是可以通过应用组合原则逐步生成的，即：一个语言的说话者可以知道无穷多句子的意义，也能够理解或表达他从未听说过意思。因此，对于语义学来说，也一定存在某种有穷的机制可以让人们理解任何一种自然语言的无穷多的句子。

因此，形式语义学的一个主要原则是语法与语义之间的关系是组合的。任何一个自然语言的语法和语义各自是按组合原则生成的，同时这两个组合原则又是相互对应的。这类似于一阶逻辑这种形式语言，其句法和语义都要遵循组合原则，且相互之间存在一种组合的对应关系。也就是说，语法与语义之间并非都是随意联系在一起的，而是可以遵循某些规则逐步组合而成的。

组合原则(广义上的)是指: 一个表达式的语义是一个关于其组成部分的语义和语法它们的组合方式的函数。(The Principle of Compositionality: The meaning of an expression is a function of the meanings of its parts and of the way they are syntactically combined.) 换句话说，一个表达式的意义是由其组成部分的意义通过合乎语法的组合方式得到的。值得注意的是，组合原理中的关键术语如 meaning, function, parts(syntax)是同应用理论密切相关的，其在不同的理论中，它们会发生变化。在这样的一个组合结构中，其组成部分可以是如下三种类型的东西：a. 根据语义特征得到的表示; b.“概念表示"(conceptual representational)中的表示，这里的语义组合是一种从语法表示到语义表示的组合翻译; c. 逻辑传统(Frege，Tarski，Carnap，Montague)下的真值条件的解释，此处，一个句子的意义是指这个句子为真时的世界是什么样的，即这个句子为真时的条件。下面的组合原则，是根据第三种解释进行的。值得注意的是，我们所给的语义解释基本是一种间接的语义解释, 即先把自然语言的表示翻译成逻辑语言，在此基础上，再给出解释的语义模型。

在形式语义学中，一个句子的真值条件可以用各种参数来衡量，其中我们把变元的赋值之外的时间、关系、地点等都成是一个模型的组成部分。这里的模型差不多等于一阶逻辑的结构概念,而在真值条件基础上的语义学被称作模型论语义学( model-theoretic semantics )。因此，Montague 语法传统下的组合原则可以表述如下:

语言 $\mathrm{L}$ 的语义任务一一通过组合的方式，为每一个 $\mathrm{L}$ 的合适句子提供真值条件。这也就是为句子的组成部分(包括每一个词项)提供模型论解释。

语言 $\mathrm{L}$ 的语法任务一一具体地给出 $\mathrm{L}$ 语言的合适表达所组成的集合，且要在这一过程中提供一种可以组合的语义。所以说，语法规则为语义规则中的组合性提供基础。

经典 Montague 语法中的基本结构:

(1)语法类和语义类型(syntactic categories and semantic types);

(2)基本的词项表达和它们的解释(basic lexical expressions and their interpretation);

(3)语法和语义规则(syntactic and semantic rules):语法规则 $\mathbf{n}$ :如果 $\alpha$ 是范畴 $A$ 的一个表达， $\beta$ 是范畴B的一个表达，那么 $\mathrm{F}_{\mathrm{i}}(\alpha, \beta)$ 是范畴 $C$ 的一个表达。(其中 $F_i$ 是表达上的某个语法运算)语义规则 $n$ :如果把 $\alpha$ 解释成 $\alpha^{\prime}$ 且 $\beta$ 解释成 $\beta^{\prime}$ ,那么把 $\mathrm{F}_{\mathrm{i}}(\alpha, \beta)$ 解释成 $\mathrm{G}_{\mathrm{k}}\left(\alpha^{\prime},\beta^{\prime}\right)_{\circ}$ (其中的 $\mathrm{G}_{\mathrm{k}}$ 是语义解释上的某个语义运算);

谓词演算及其不足

谓词演算

R.Montague 1970在“English as a Formal Language”中提出，可以把英语看成是一种形式语义，即可以把逻辑学家用来处理语义和语法的方法引进到形式语义学的处理中，如谓词演算(predicate calculus). 我们下面就来看看谓词演算PC这种形式语言的具体内容。

语法:

语法范畴:项，一元谓词(Pred-1), 二元谓词(Pred-2),…, n-元谓词(Pred-n)，公式 (Form).

基本的表达:

基本的项:
(i) (个体) 变元: $x_{1}, y_{1}, z_{1}, x_{2}, \ldots$
(ii) (个体) 常元: a,b,c, a_, .John, Mary,…
基本的 Pred-1: run, walk, happy, calm, …
基本的 Pred-2: love, kiss, like, see, …
基本的公式: - 无 -

注意：这里没有传统一阶逻辑中的原子公式，同时在语言中引进 John, Mary 等便于记忆的自然语言符号作为常项符号，谓词中也同样引进这些加粗的自然语言。这样做的好处是在进行语义解释时很方便。因此，在这个语言中加粗的自然语言符号是 PC 中的对象语言。

语法规则:

R1:如果 $\mathrm{P} \in$ Pred-1 且 $\mathrm{T} \in \mathrm{Term},$ 那么 $\mathrm{P}(\mathrm{T}) \in$ Form.
R2:如果 $\mathrm{R} \in$ Pred- 2 且 $\mathrm{T}_{1}, \mathrm{~T}_{2} \in \mathrm{Term},$ 那么 $\mathrm{R}\left(\mathrm{T}_{1}, \mathrm{~T}_{2}\right) \in$ Form.
更一般的规则：如果R $\in$ Pred-n 且 $\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}} \in$ Term，那么 $\mathrm{R}\left(\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}}\right) \in$ Form.
R3:如果 $\varphi \in$ Form，那么 $\neg \varphi \in$ Form.
R4:如果 $\varphi \in$ Form 且 $\psi \in$ Form, 那么 $(\varphi \& \psi) \in$ Form.
R5:如果 $\varphi \in$ Form 且 $\psi \in$ Form, 那么 $(\varphi \vee \psi) \in$ Form.
R6:如果 $\varphi \in$ Form 且 $\psi \in$ Form, 那么 $(\varphi \rightarrow \psi) \in$ Form.
R7:如果 $v$ 是一个变元且 $\varphi \in$ Form，那么 $\forall v \varphi \in$ Form.
R8:如果 $v$ 是一个变元且 $\varphi \in$ Form, 那么 $\exists v \varphi \in$ Form.

语义模型结构

个体的定义域 $\mathrm{D}$ (Domain $\mathrm{D}$ of entities(individuals))真值:{真,假} or {1,0};

$I$ : 对所有的常元进行赋值的解释;

$\mathbf{M}=<\mathrm{D},\mathrm{I}>$ ;

$\mathrm{G}=\{$ 赋值函数 $g$ :把个体变元赋到定义域 $\mathrm{D}$ 中的某个个体 $\}$ ;

语法结构的语义类型

项:实体(entities),个体; 其语义值是 $D$ 中的个体;
谓词 Pred-1: (个体的)集合(of entities);其语义值 $\in \wp(\mathrm{D}).(\wp(\mathrm{D})$ 是 $\mathrm{D}$ 的幕集)。
谓词 Pred-2: 个体间的关系(有序对的集合);其语义值 $\in \wp(\mathrm{D} \times \mathrm{D})$ ;
n-元谓词Pred-n: n-元关系; 实体的 n-元拓扑;
关系所组成的集合(sets of n-tuples of entities);其语义值 $\in \wp(\mathrm{D} \times \ldots \times \mathrm{D})$ ;
公式:真值;其语义值 $\in\{0,1\}$ ;

相对于 $M$ , $g$ 的语义解释:
$\|\varphi\|^{M,g}$ 表示表达 $\varphi$ 在 $M$ , $g$ 下的语义解释;

基本的表达(“词的语义"):
A. 如果 $\alpha$ 是一个变元, 那么 $\|\alpha\|^{M, g}=g(\alpha).$
B. 如果 $\alpha$ 是一个常元, 那么 $\|\alpha\|^{M, g}=I(\alpha).$

语义规则(“语法的语义”):
S1:如果 $\in$ Pred-1且 $\mathrm{T} \in \mathrm{Term}$ ,那么 $\|\mathrm{P}(\mathrm{T})\|^{\mathrm{M}, g}=1$ 当且仅当 $\|\mathrm{T}\|^{\mathrm{M}, g} \in\|\mathrm{P}\|^{\mathrm{M}, g}$ .
S2:更一般的规则：如果R $\in$ Pred-n 且 $\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}} \in \mathrm{Term}$ ,那么 $\left\|\mathrm{R}\left(\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}}\right)\right\|^{\mathrm{M}, g}=1$ ;

当且仅当 $\quad<\left\|\mathrm{T}_{1}\right\|^{\mathrm{M}, g}, \ldots,\left\|\mathrm{T}_{\mathrm{n}}\right\|^{\mathrm{M}, g}>\in\|\mathrm{R}\|^{\mathrm{M}, g}$

S3:如果 $\varphi \in \mathrm{Form}$ ,那么 $\|\neg \varphi\|^{\mathrm{M}, g}=1$ 当且仅当 $\|\varphi\|^{\mathrm{M}, g}=0$ .
S4:如果 $\varphi, \psi \in$ Form,那么 $\|(\varphi \& \psi)\|^{\mathrm{M}, g}=1$ 当且仅当 $\|\varphi\|^{\mathrm{M}, g}=1$ 且 $\|\psi\|^{\mathrm{M}, g}=1$ .
S5:如果 $\varphi,\psi \in$ Form,那么 $\|(\varphi \vee \psi)\|^{\mathrm{M}, g}=1$ 当且仅当 $\|\varphi\|^{\mathrm{M}, g}=1$ 或 $\|\psi\|^{\mathrm{M}, g}=1$ .
S6:如果 $\varphi, \psi \in$ Form, 那么 $\|(\varphi \rightarrow \psi)\|^{\mathrm{M}, g}=1$ 当且仅当 $\|\varphi\|^{\mathrm{M}, g}=0$ 或 $\|\psi\|^{\mathrm{M}, g}=1$ .
S7:如果 $v$ 是一个变元且 $\varphi \in$ Form, 那么 $\|\forall v \varphi\|^{\mathrm{M}, g}=1$ 当且仅当对所有的d $\in \mathrm{D}$ , 有 $\|\varphi\|^{\mathrm{M}, g[\mathrm{~d} / v]}=1$
S8:如果 $v$ 是一个变元且 $\varphi \in \mathrm{Form},$ 那么 $\|\exists v \varphi\|^{\mathrm{M}, g}=1$ 当且仅当存在一个 $\mathrm{d} \in \mathrm{D}$ 使得 $\|\varphi\|^{M,g[d/v]}=1$

真:一些公式的真是独立于变元的赋值的; 所以它们在 $M$ 下是真的，即有如下的解释:

如果 $\varphi \in$ Form，那么 $:\|\varphi\|^{\mathrm{M}}=1$ 当且仅当对所有的赋值 $g,\|\varphi\|^{\mathrm{M}, g}=1 \circ$ ;

$\|\varphi\|^{\mathrm{M}}=0$ 当且仅当对所有的赋值 $g,\|\varphi\|^{\mathrm{M}, g}=0 \circ$ ;

否则 $\|\varphi\|^{\mathrm{M}}$ 是不明确的。

谓词演算PC的范畴	自然语言NL的范畴
公式	句子
谓词	动词、通名、形容词
项	无
常项	专名
变元	代词(他、她、它)

谓词演算PC的范畴不能对应的还有:动词短语、名词短语、通名短语、形容词短语、限定词(Determiner)、介词、介词短语、副词;

所以，在谓词演算PC中，自然语言的许多词组都得不到合适的表示。例如，动词短语同简单的动词一样也是谓词，只不过是经过简单的动词和名词其它的词组合地得到的。但是，原有PC理论无法给动词短语一个与自然语言现象一致的解释。另外，对于PC还不能解决自然语言表达的辖域模糊性问题。看下面两个例子。

例1:年老的男人和女人(old men and women)

这里的修饰词“年老的”既可以管辖“男人和女人”，也可以只管辖“男人”。因此，存在两种不同的解读结构。

例2:每一个学生读一本书(Every student read a book)

可以有如下两种逻辑表达式:
i) $\forall x($ Student $\rightarrow \exists y($ Book $\& \operatorname{Read}(x, y))$
ii) $\exists \mathrm{y}($ Book $(\mathrm{y}) \& \forall \mathrm{x}($ Student $(\mathrm{x}) \rightarrow \operatorname{Read}(\mathrm{x}, \mathrm{y}))$

因此，用PC处理自然语言的表达时，仍存在许多问题。对于一些自然语言的表达，我们找不到相应的逻辑范畴，也因此不能够使语义解释完全符合组合原则。但是，Lambda算子可以在一定程度上弥补这些不足。后面的几个部分的论述都将围绕lambda-演算(后面都记作 $\lambda$ -演算) 在自然语言的语义解释中所发挥的作用。

参考文献

[1] Chierchia, Gennaro, and McConnell-Ginet, Sally.2000. Meaning and Grammar: An Introduction to Semantics. Cambridge: MIT Press.
[2] Lambda-演算在形式语义学的中应用I.傅庆芳.
[3] Partee, Barbara H. $2007 .$ Formal Semantics and Current Problems of Semantics.

hanss2

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【代数语言学巡礼】Lambda-演算在形式语义学的中应用I

【代数语言学巡礼】Lambda-演算在形式语义学的中应用(上)代数语言学又称做形式语言学,其基础思想是建立语言的数学模型,如美国逻辑学家、语言学家N.乔姆斯基、苏联数学家О.С.库拉金娜、语言学家Y.巴尔-希列尔分别提出了语言的生成性模型、分析性模型和辨识性模型.形式语义学与组合原则自Chomsky创立生成语法（generative grammar）以来，人们开始普遍承认语法是可以按组合原则逐步生成的。生成语法的一个基本出发点是: 自然语言中存在无穷多的句子，同时大脑的功能是有限的,
复制链接

扫一扫

专栏目录