冯志伟
上海外语教育出版社(1996)
现代语言学丛书
ISBN 7-81046-036-6
TP 391 816.1
前言
P3 自然语言处理(Natural Language Processing,简称NLP)就是利用电子计算机为工具对人类的书面形式和口头形式的自然语言的信息进行各种类型的处理和加工的技术,这种技术现在已经形成一门专门的边缘性交叉性学科,它涉及语言学、数学和计算机科学,横跨文科、理科和工科三大知识领域。……自然语言处理的目的在于建立各种自然语言处理系统。
P5 自然语言起码在下面4个当面与人工语言大相径庭:
1、自然语言中充满着歧义,而人工语言中的歧义则是可以控制的;
2、自然语言的结构复杂多样,而人工语言的结构则相对简单;
3、自然语言的语义表达千变万化,迄今还没有一种简单而通用的途径来描述它,而人工语言的语义则是可以由人来直接定义;
4、自然语言的结构和语义之间有着千丝万缕的、错综复杂的联系,一般不存在一一对应的同构关系;而人工语言则常常可以把结构和语义分别进行处理,人工语言的结构和语义之间有着整齐的一一对应的同构关系。
正文
P8 乔姆斯基定义了0型语法、上下文无关语法、上下文有关语法和正则语法4种类型的形式语法。其中上下文无关语法又叫做短语结构语法(phrase structure grammar,简称PSG)。……但是,人们不久就发现,短语结构语法的生成能力过强,往往会生成大量的不合语法的句子。……于是他提出装换语法来克服短语结构语法的这些弱点,后来转换语法逐渐发展成为转换生成语法。……由于短语结构语法结构清晰,易于操作,计算语言学的学者们抛弃了转换生成语法,又转向了短语结构语法,于是出现了各种增强的短语结构语法。例如,受限语言(restricted language)和扩充转移网络(augemented transition network,简称ATN)。受限语言的表层结构分析和深层结构分析是分别进行的,而ATN的表层结构分析和深层结构分析则是同时进行的。
P10 不论哪一种自然语言处理的语法,其最根本、最关键的问题,是要指出各种语言形式出现和变换的条件。只有指出了条件,计算机才可能根据有关的条件,执行相应的动作,从而使整个系统成为一个可以动态地执行的过程。
P11 总而言之,计算机的任何操作,归根结底,可以归纳为一个公式:
条件→动作
……<