【代数语言学巡礼】Lambda-演算在形式语义学的中应用I

【代数语言学巡礼】Lambda-演算在形式语义学的中应用I


代数语言学又称做形式语言学,其基础思想是建立语言的数学模型,如美国逻辑学家、语言学家N.乔姆斯基、苏联数学家О.С.库拉金娜 、语言学家Y.巴尔-希列尔分别提出了语言的生成性模型 、分析性模型和辨识性模型.


形式语义学与组合原则

自Chomsky创立生成语法(generative grammar)以来,人们开始普遍承认语法是可以 按组合原则逐步生成的。生成语法的一个基本出发点是: 自然语言中存在无穷多的句子,同 时大脑的功能是有限的, 所以我们的语言能力必须包含某种可以描述这些无穷多句子类型的 有穷机制。也就是说,通过这些有穷的机制,我们可以不断地对已有的元素进行组合,并生 成无穷多的句子或语法类型。因此,可以用形式化的方法分析句子的语法及其生成过程。

但是,在很长一段时间里,Chomsky反对把组合原则和形式化方法应用到语义学的研究 中。这是因为语义问题不像语法结构那样有比较清楚的结构,尤其是,很难有与语法相对应 的组合生成的语义解释。然而,组合原则对于形式语义学是至关重要的,如果不能在自然语 言的语义研究中很好地贯彻组合原则,那么也就没有形式语义学这一研究领域。这成为形式 语义学发展的一个瓶颈。Chomsky对形式语义学基本持怀疑态度。在很长的时间里,MIT一 直没有研究形式语义学的人,直到 1989 年Chomsky才聘请了 Irene Heim 去MIT工作。这时的 形式语义学已经发展得比较成熟。

形式语义学的想法是,对应于语法中的组合原则,语义解释也应该是可以通过应用组合 原则逐步生成的,即:一个语言的说话者可以知道无穷多句子的意义,也能够理解或表达他 从未听说过意思。因此,对于语义学来说,也一定存在某种有穷的机制可以让人们理解任何 一种自然语言的无穷多的句子。

因此,形式语义学的一个主要原则是语法与语义之间的关系是组合的。任何一个自然语 言的语法和语义各自是按组合原则生成的,同时这两个组合原则又是相互对应的。这类似于一阶逻辑这种形式语言,其句法和语义都要遵循组合原则,且相互之间存在一种组合的对应 关系。也就是说,语法与语义之间并非都是随意联系在一起的,而是可以遵循某些规则逐步组合而成的。

组合原则(广义上的)是指: 一个表达式的语义是一个关于其组成部分的语义和语法 它们的组合方式的函数。(The Principle of Compositionality: The meaning of an expression is a function of the meanings of its parts and of the way they are syntactically combined.) 换句话说,一个表达式的意义是由其组成部分的意义通过合乎语法的组合方式得到的。 值得注意的是,组合原理中的关键术语如 meaning, function, parts(syntax)是同应用理论密切 相关的,其在不同的理论中,它们会发生变化。在这样的一个组合结构中,其组成部分可以 是如下三种类型的东西:a. 根据语义特征得到的表示; b.“概念表示"(conceptual representational)中的表示,这里的语义组合是一种从语法表示到语义表示的组合翻译; c. 逻辑传统(Frege,Tarski,Carnap,Montague)下的真值条件的解释,此处,一个句子的意义是指这个句子为真时的世界是什么样的,即这个句子为真时的条件。下面的组合原则,是根据第三种解释进行的。值得注意的是,我们所给的语义解释基本是一种间接的语义解释, 即先把自然语言的表示翻译成逻辑语言,在此基础上,再给出解释的语义模型。

在形式语义学中,一个句子的真值条件可以用各种参数来衡量,其中我们把变元的赋 值之外的时间、关系、地点等都成是一个模型的组成部分。这里的模型差不多等于一阶逻辑 的结构概念,而在真值条件基础上的语义学被称作模型论语义学( model-theoretic semantics )。 因此,Montague 语法传统下的组合原则可以表述如下:

语言 L \mathrm{L} L 的语义任务一一通过组合的方式,为每一个 L \mathrm{L} L 的合适句子提供真值条件。这也 就是为句子的组成部分(包括每一个词项)提供模型论解释。

语言 L \mathrm{L} L 的语法任务一一具体地给出 L \mathrm{L} L 语言的合适表达所组成的集合,且要在这一过程 中提供一种可以组合的语义。所以说,语法规则为语义规则中的组合性提供基础。

经典 Montague 语法中的基本结构:

(1)语法类和语义类型(syntactic categories and semantic types);

(2)基本的词项表达和它们的解释(basic lexical expressions and their interpretation);

(3)语法和语义规则(syntactic and semantic rules):语法规则 n \mathbf{n} n:如果 α \alpha α是范畴 A A A的一个表达, β \beta β是范畴B的一个表达,那么 F i ( α , β ) \mathrm{F}_{\mathrm{i}}(\alpha, \beta) Fi(α,β)是范畴 C C C的一个表达。(其中 F i F_i Fi是表达上的某个语法运算)语义规则 n n n:如果把 α \alpha α解释成 α ′ \alpha^{\prime} α β \beta β解释成 β ′ \beta^{\prime} β,那么把 F i ( α , β ) \mathrm{F}_{\mathrm{i}}(\alpha, \beta) Fi(α,β)解释成 G k ( α ′ , β ′ ) ∘ \mathrm{G}_{\mathrm{k}}\left(\alpha^{\prime},\beta^{\prime}\right)_{\circ} Gk(α,β)(其中的 G k \mathrm{G}_{\mathrm{k}} Gk是语义解释上的某个语义运算);


谓词演算及其不足

谓词演算

R.Montague 1970在“English as a Formal Language”中提出,可以把英语看成是一种形 式语义,即可以把逻辑学家用来处理语义和语法的方法引进到形式语义学的处理中,如谓词演算(predicate calculus). 我们下面就来看看谓词演算PC这种形式语言的具体内容。

语法:

语法范畴:项,一元谓词(Pred-1), 二元谓词(Pred-2),…, n-元谓词(Pred-n),公式 (Form).

基本的表达:

基本的项:
(i) (个体) 变元: x , y , z , x 1 , y 1 , z 1 , x 2 , … x, y, z, x_{1}, y_{1}, z_{1}, x_{2}, \ldots x,y,z,x1,y1,z1,x2,
(ii) (个体) 常元: a,b,c, a_, .John, Mary,…
基本的 Pred-1: run, walk, happy, calm, …
基本的 Pred-2: love, kiss, like, see, …
基本的公式: - 无 -

注意:这里没有传统一阶逻辑中的原子公式,同时在语言中引进 John, Mary 等便于记忆的 自然语言符号作为常项符号,谓词中也同样引进这些加粗的自然语言。这样做的好处是在进行语义解释时很方便。因此,在这个语言中加粗的自然语言符号是 PC 中的对象语言。

语法规则:

R1:如果 P ∈ \mathrm{P} \in P Pred-1 且 T ∈ T e r m , \mathrm{T} \in \mathrm{Term}, TTerm, 那么 P ( T ) ∈ \mathrm{P}(\mathrm{T}) \in P(T) Form.
R2:如果 R ∈ \mathrm{R} \in R Pred- 2 且 T 1 ,   T 2 ∈ T e r m , \mathrm{T}_{1}, \mathrm{~T}_{2} \in \mathrm{Term}, T1, T2Term, 那么 R ( T 1 ,   T 2 ) ∈ \mathrm{R}\left(\mathrm{T}_{1}, \mathrm{~T}_{2}\right) \in R(T1, T2) Form.
更一般的规则:如果R ∈ \in Pred-n 且 T 1 , … , T n ∈ \mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}} \in T1,,Tn Term,那么 R ( T 1 , … , T n ) ∈ \mathrm{R}\left(\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}}\right) \in R(T1,,Tn) Form.
R3:如果 φ ∈ \varphi \in φ Form,那么 ¬ φ ∈ \neg \varphi \in ¬φ Form.
R4:如果 φ ∈ \varphi \in φ Form 且 ψ ∈ \psi \in ψ Form, 那么 ( φ & ψ ) ∈ (\varphi \& \psi) \in (φ&ψ) Form.
R5:如果 φ ∈ \varphi \in φ Form 且 ψ ∈ \psi \in ψ Form, 那么 ( φ ∨ ψ ) ∈ (\varphi \vee \psi) \in (φψ) Form.
R6:如果 φ ∈ \varphi \in φ Form 且 ψ ∈ \psi \in ψ Form, 那么 ( φ → ψ ) ∈ (\varphi \rightarrow \psi) \in (φψ) Form.
R7:如果 v v v 是一个变元 且 φ ∈ \varphi \in φ Form,那么 ∀ v φ ∈ \forall v \varphi \in vφ Form.
R8:如果 v v v 是一个变元 且 φ ∈ \varphi \in φ Form, 那么 ∃ v φ ∈ \exists v \varphi \in vφ Form.

语义模型结构

个体的定义域 D \mathrm{D} D(Domain D \mathrm{D} D of entities(individuals))真值:{真,假} or {1,0};

I I I: 对所有的常元进行赋值的解释;

M = < D , I > \mathbf{M}=<\mathrm{D},\mathrm{I}> M=<D,I>;

G = { \mathrm{G}=\{ G={赋值函数 g g g:把个体变元赋到定义域 D \mathrm{D} D中的某个个体 } \} };

语法结构的语义类型

项:实体(entities),个体; 其语义值是 D D D中的个体;
谓词 Pred-1: (个体的)集合(of entities);其语义值 ∈ ℘ ( D ) . ( ℘ ( D ) \in \wp(\mathrm{D}).(\wp(\mathrm{D}) (D).((D) D \mathrm{D} D的幕集)。
谓词 Pred-2: 个体间的关系(有序对的集合);其语义值 ∈ ℘ ( D × D ) \in \wp(\mathrm{D} \times \mathrm{D}) (D×D);
n-元谓词Pred-n: n-元关系; 实体的 n-元拓扑;
关系所组成的集合(sets of n-tuples of entities);其语义值 ∈ ℘ ( D × … × D ) \in \wp(\mathrm{D} \times \ldots \times \mathrm{D}) (D××D);
公式:真值;其语义值 ∈ { 0 , 1 } \in\{0,1\} {0,1};

相对于 M M M, g g g的语义解释:
∥ φ ∥ M , g \|\varphi\|^{M,g} φM,g表示表达 φ \varphi φ M M M, g g g下的语义解释;

基本的表达(“词的语义"):
A. 如果 α \alpha α 是一个变元, 那么 ∥ α ∥ M , g = g ( α ) . \|\alpha\|^{M, g}=g(\alpha). αM,g=g(α).
B. 如果 α \alpha α 是一个常元, 那么 ∥ α ∥ M , g = I ( α ) . \|\alpha\|^{M, g}=I(\alpha). αM,g=I(α).

语义规则(“语法的语义”):
S1:如果 P ∈ P \in P Pred-1且 T ∈ T e r m \mathrm{T} \in \mathrm{Term} TTerm,那么 ∥ P ( T ) ∥ M , g = 1 \|\mathrm{P}(\mathrm{T})\|^{\mathrm{M}, g}=1 P(T)M,g=1当且仅当 ∥ T ∥ M , g ∈ ∥ P ∥ M , g \|\mathrm{T}\|^{\mathrm{M}, g} \in\|\mathrm{P}\|^{\mathrm{M}, g} TM,gPM,g.
S2:更一般的规则:如果R ∈ \in Pred-n 且 T 1 , … , T n ∈ T e r m \mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}} \in \mathrm{Term} T1,,TnTerm,那么 ∥ R ( T 1 , … , T n ) ∥ M , g = 1 \left\|\mathrm{R}\left(\mathrm{T}_{1}, \ldots, \mathrm{T}_{\mathrm{n}}\right)\right\|^{\mathrm{M}, g}=1 R(T1,,Tn)M,g=1;

当且仅当 < ∥ T 1 ∥ M , g , … , ∥ T n ∥ M , g > ∈ ∥ R ∥ M , g \quad<\left\|\mathrm{T}_{1}\right\|^{\mathrm{M}, g}, \ldots,\left\|\mathrm{T}_{\mathrm{n}}\right\|^{\mathrm{M}, g}>\in\|\mathrm{R}\|^{\mathrm{M}, g} <T1M,g,,TnM,g>RM,g

S3:如果 φ ∈ F o r m \varphi \in \mathrm{Form} φForm,那么 ∥ ¬ φ ∥ M , g = 1 \|\neg \varphi\|^{\mathrm{M}, g}=1 ¬φM,g=1当且仅当 ∥ φ ∥ M , g = 0 \|\varphi\|^{\mathrm{M}, g}=0 φM,g=0.
S4:如果 φ , ψ ∈ \varphi, \psi \in φ,ψForm,那么 ∥ ( φ & ψ ) ∥ M , g = 1 \|(\varphi \& \psi)\|^{\mathrm{M}, g}=1 (φ&ψ)M,g=1当且仅当 ∥ φ ∥ M , g = 1 \|\varphi\|^{\mathrm{M}, g}=1 φM,g=1 ∥ ψ ∥ M , g = 1 \|\psi\|^{\mathrm{M}, g}=1 ψM,g=1.
S5:如果 φ , ψ ∈ \varphi,\psi \in φ,ψ Form,那么 ∥ ( φ ∨ ψ ) ∥ M , g = 1 \|(\varphi \vee \psi)\|^{\mathrm{M}, g}=1 (φψ)M,g=1当且仅当 ∥ φ ∥ M , g = 1 \|\varphi\|^{\mathrm{M}, g}=1 φM,g=1 ∥ ψ ∥ M , g = 1 \|\psi\|^{\mathrm{M}, g}=1 ψM,g=1.
S6:如果 φ , ψ ∈ \varphi, \psi \in φ,ψ Form, 那么 ∥ ( φ → ψ ) ∥ M , g = 1 \|(\varphi \rightarrow \psi)\|^{\mathrm{M}, g}=1 (φψ)M,g=1当且仅当 ∥ φ ∥ M , g = 0 \|\varphi\|^{\mathrm{M}, g}=0 φM,g=0 ∥ ψ ∥ M , g = 1 \|\psi\|^{\mathrm{M}, g}=1 ψM,g=1.
S7:如果 v v v 是一个变元 且 φ ∈ \varphi \in φ Form, 那么 ∥ ∀ v φ ∥ M , g = 1 \|\forall v \varphi\|^{\mathrm{M}, g}=1 vφM,g=1 当且仅当 对所有的d ∈ D \in \mathrm{D} D, 有 ∥ φ ∥ M , g [   d / v ] = 1 \|\varphi\|^{\mathrm{M}, g[\mathrm{~d} / v]}=1 φM,g[ d/v]=1
S8:如果 v v v 是一个变元且 φ ∈ F o r m , \varphi \in \mathrm{Form}, φForm, 那么 ∥ ∃ v φ ∥ M , g = 1 \|\exists v \varphi\|^{\mathrm{M}, g}=1 vφM,g=1 当且仅当存在一个 d ∈ D \mathrm{d} \in \mathrm{D} dD使得 ∥ φ ∥ M , g [ d / v ] = 1 \|\varphi\|^{M,g[d/v]}=1 φM,g[d/v]=1

:一些公式的真是独立于变元的赋值的; 所以它们在 M M M下是真的,即有如下的解释:

如果 φ ∈ \varphi \in φ Form,那么 : ∥ φ ∥ M = 1 :\|\varphi\|^{\mathrm{M}}=1 :φM=1 当且仅当 对所有的赋值 g , ∥ φ ∥ M , g = 1 ∘ g,\|\varphi\|^{\mathrm{M}, g}=1 \circ g,φM,g=1;

∥ φ ∥ M = 0 \|\varphi\|^{\mathrm{M}}=0 φM=0 当且仅当 对所有的赋值 g , ∥ φ ∥ M , g = 0 ∘ g,\|\varphi\|^{\mathrm{M}, g}=0 \circ g,φM,g=0;

否则 ∥ φ ∥ M \|\varphi\|^{\mathrm{M}} φM 是不明确的。

谓词演算PC的范畴自然语言NL的范畴
公式句子
谓词动词、通名、形容词
常项专名
变元代词(他、她、它)

谓词演算PC的范畴不能对应的还有:动词短语、名词短语、通名短语 、形容词短语、限定词(Determiner)、介词、介词短语、副词;

所以,在谓词演算PC中,自然语言的许多词组都得不到合适的表示。例如,动词短语同简单的动词一样也是谓词,只不过是经过简单的动词和名词其它的词组合地得到的。但是,原有PC理论无法给动词短语一个与自然语言现象一致的解释。 另外,对于PC还不能解决自然语言表达的辖域模糊性问题。看下面两个例子。

例1:年老的男人和女人(old men and women)

这里的修饰词“年老的”既可以管辖“男人和女人”,也可以只管辖“男人”。因此,存在两种不同的解读结构。

例2:每一个学生读一本书(Every student read a book)

可以有如下两种逻辑表达式:
i) ∀ x ( \forall x( x( Student ( x ) → ∃ y ( (x) \rightarrow \exists y( (x)y( Book ( y ) & Read ⁡ ( x , y ) ) (y) \& \operatorname{Read}(x, y)) (y)&Read(x,y))
ii) ∃ y ( \exists \mathrm{y}( y( Book ( y ) & ∀ x ( (\mathrm{y}) \& \forall \mathrm{x}( (y)&x( Student ( x ) → Read ⁡ ( x , y ) ) (\mathrm{x}) \rightarrow \operatorname{Read}(\mathrm{x}, \mathrm{y})) (x)Read(x,y))

因此,用PC处理自然语言的表达时,仍存在许多问题。对于一些自然语言的表达,我们找不到相应的逻辑范畴,也因此不能够使语义解释完全符合组合原则。但是,Lambda算子可以在一定程度上弥补这些不足。后面的几个部分的论述都将围绕lambda-演算(后面都记作 λ \lambda λ-演算) 在自然语言的语义解释中所发挥的作用。


参考文献

[1] Chierchia, Gennaro, and McConnell-Ginet, Sally.2000. Meaning and Grammar: An Introduction to Semantics. Cambridge: MIT Press.
[2] Lambda-演算在形式语义学的中应用I.傅庆芳.
[3] Partee, Barbara H. 2007. 2007 . 2007. Formal Semantics and Current Problems of Semantics.


  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值