笔记:自然语言的计算机处理

自然语言处理(NLP)结合语言学、数学和计算机科学,旨在建立处理和加工自然语言信息的系统。文章探讨了自然语言与人工语言的区别,包括歧义、结构复杂性、语义表达和结构语义关系。介绍了乔姆斯基的语法类型,特别是短语结构语法和转换生成语法,强调条件与动作的关系在计算机操作中的重要性,以及汉语处理中的特殊挑战。此外,文章还讨论了语言的层次性、非单元性和离散性,并提到逻辑语法和逻辑程序设计的相关概念。
摘要由CSDN通过智能技术生成

冯志伟 

上海外语教育出版社(1996)

现代语言学丛书

ISBN 7-81046-036-6

TP 391 816.1

 

前言

P3 自然语言处理(Natural Language Processing,简称NLP)就是利用电子计算机为工具对人类的书面形式和口头形式的自然语言的信息进行各种类型的处理和加工的技术,这种技术现在已经形成一门专门的边缘性交叉性学科,它涉及语言学、数学和计算机科学,横跨文科、理科和工科三大知识领域。……自然语言处理的目的在于建立各种自然语言处理系统。

 

P5 自然语言起码在下面4个当面与人工语言大相径庭:
1、自然语言中充满着歧义,而人工语言中的歧义则是可以控制的;
2、自然语言的结构复杂多样,而人工语言的结构则相对简单;
3、自然语言的语义表达千变万化,迄今还没有一种简单而通用的途径来描述它,而人工语言的语义则是可以由人来直接定义;
4、自然语言的结构和语义之间有着千丝万缕的、错综复杂的联系,一般不存在一一对应的同构关系;而人工语言则常常可以把结构和语义分别进行处理,人工语言的结构和语义之间有着整齐的一一对应的同构关系。

 

正文

 

P8 乔姆斯基定义了0型语法、上下文无关语法、上下文有关语法和正则语法4种类型的形式语法。其中上下文无关语法又叫做短语结构语法(phrase structure grammar,简称PSG)。……但是,人们不久就发现,短语结构语法的生成能力过强,往往会生成大量的不合语法的句子。……于是他提出装换语法来克服短语结构语法的这些弱点,后来转换语法逐渐发展成为转换生成语法。……由于短语结构语法结构清晰,易于操作,计算语言学的学者们抛弃了转换生成语法,又转向了短语结构语法,于是出现了各种增强的短语结构语法。例如,受限语言(restricted language)和扩充转移网络(augemented transition network,简称ATN)。受限语言的表层结构分析和深层结构分析是分别进行的,而ATN的表层结构分析和深层结构分析则是同时进行的。

 

P10 不论哪一种自然语言处理的语法,其最根本、最关键的问题,是要指出各种语言形式出现和变换的条件。只有指出了条件,计算机才可能根据有关的条件,执行相应的动作,从而使整个系统成为一个可以动态地执行的过程。

 

P11 总而言之,计算机的任何操作,归根结底,可以归纳为一个公式:

条件→动作

……<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值