自然语言处理总论---导论部分摘要

第一章 导论
1.1语音与语言处理中的知识
定义:把处理口语和书面语的计算技术称为语音和语言处理,简称自然语言处理(包括词数计算、自动换行、以及web上的自动问答、实时的口语自动翻译等高级技术)
六个方面:
A.语音学与音系学 例如:作为机器我需要分析我所接收的声音信号,并且把这些信号复原成词的系列。与此相似,为了生成回答,我也必须将我的回答组织成词的系列,并且生成人能够识别的声音信号。要完成这两方面任务,就需要语音学与音系学的知识
B.形态学 例如:机器能够说出类似i’m can’t这样的缩约形式并且识别单词的变体,例如doors,就要求形态学方面的知识。
C.句法学 例如:机器必须使用人熟悉的语言结构把一个个单词组织成符号串,构成它的回答
D.语义学 例子:机器要具备复合词的语义的知识,有词汇语义学的知识以及如何把这样的复合词组成更大的语言意义实体的知识,即关于组合语义学的知识
E.语用学 例如:机器人要文明回答各种问题
F.话语学 例如:机器在回答的过程中要学会正确的使用that或者中文中的这个那个来简单的标识回话段落中的共同部分,这就叫话语学

1.2 歧异
例子:I made her duck
解决歧义的方法:词类标准(词性)、词义棑歧(词意)、句法排歧、概率剖析、语言行为解释(语气)
1.3模型和算法
包括(状态机、形式规则系统、逻辑、概率论)
1.4 语言、思维和理解
举了图灵和Eliza的例子,没啥实际内容
1.5科学现状与近期发展

1.6语音和语言处理简史
基础研究:20世纪40年代到20世纪50年代(自动机的研究、概率或信息论模型的研究)
两个阵营 符号派(形式语言理论和生成句法研究、人工智能的研究) 随机派
四个范型:1970-1983(随机范型、基于逻辑的范型、基于自然语言理解的范型、话语模型范型)
经验主义和有限状态模型的复苏(1983-1993)
不同领域的合流:(1994-1999) 1、概率和数据驱动成了自然语言处理的标准方法 2、语音和语言处理的算法开始被应用于增强交替通信 3、web的发展使得增强信息检索和信息抽取的需求变得更加突出
多重发现 告诉我们一个事物可能同时被多个科学家研究
心理学的简要注记 告诉我们模拟人类的行为模式对自然语言的处理很有效
1.7小结 略
1.8文献和历史说明 略

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值