《数学之美》——快速阅读·第二章·自然语言处理（摘录、分享）

最新推荐文章于 2024-08-02 22:13:37 发布

柚芷

最新推荐文章于 2024-08-02 22:13:37 发布

阅读量716

点赞数

分类专栏：自然语言处理文章标签：数学之美自然语言处理人工智能大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caicai0001000/article/details/82773644

版权

自然语言处理专栏收录该内容

13 篇文章 1 订阅

订阅专栏

第二章自然语言处理——从规则到统计

自然语言从产生开始，逐渐演变成一种上下文相关的信息表达和传递的方式，因此让计算机处理自然语言，一个基本的问题就是为自然语言这种上下文相关的特性建立数学模型。

1、机器智能

图灵测试：让人和机器进行交流，如果人无法判断自己交流的对象是人还是机器，就说明这个机器有智能了。

自然语言发展的两个阶段：1、用电脑模拟人脑；2、基于数学模型和统计的方法。

达特茅斯夏季人工智能研究会议：一次关于人工智能、自然语言处理和神经网络的重要会议。

学术界曾认为，要让机器完成翻译或者语音识别等只有人类才能做的事，必须先让计算机理解自然语言，而做到这一点就必须让计算机拥有类似我们人类这样的智能。而事实上，今天的机器翻译和语音识别更多依赖的是数学，更准确的说是统计。

随编译器技术发展，计算机高级程序语言都可以概括成上下文无关文法，这是一个算法上可以在多项式时间内解决的问题。高级程序语言规则和自然语言规则从形式上看很相似，因此联想到用类似方法对自然语言进行分析。而在实际使用时发现了问题：

（1）要想通过文法规则覆盖哪怕20%的真实语句，文法规则的数量至少几万条。而当这些文法规则出现矛盾时，还要说明各个规则的使用环。这样下去，文法规则的数量最后会多到每增加一个新句子，就要加入一个新的文法。

（2）即使能够写出所有自然语言现象的语法规则合集，也很难用计算机来解析。描述自然语法的文法和计算机高级程序语言的文法不同，自然语言在演变过程中，产生了词义和上下文相关的特性。

2、从规则到统计

1970年以后统计语言学的出现使得自然那语言处理重获新生，并且取得非凡成就。此处提及IBM华生实验室。

到20世纪90年代末，大家发现通过统计得到的句法规则甚至比语言学家总结的更具有说服力。2005年以后，随Goole基于统计方法的翻译系统全面超过基于规则方法的SysTran翻译系统，基于规则方法学派固守的最后一个堡垒被拔掉了。

自然语言处理的应用在过去25年发生了巨大变化，如自动问答的需求很大程度上被网页搜索和数据挖掘替代了。而新的应用越来越依靠数据的作用和浅层的自然语言处理的工作，这在客观上加速了自然语言处理研究从事基于规则的方法到基于统计方法的转变。

此处分享几篇文章：

阿里自然语言处理部总监分享：NLP技术的应用及思考：http://www.sohu.com/a/138692749_657157

四个自然语言处理(NLP)业务应用程序：http://www.sohu.com/a/211623348_246648

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《数学之美》——快速阅读·第二章·自然语言处理（摘录、分享）

第二章自然语言处理——从规则到统计自然语言从产生开始，逐渐演变成一种上下文相关的信息表达和传递的方式，因此让计算机处理自然语言，一个基本的问题就是为自然语言这种上下文相关的特性建立数学模型。 1、机器智能图灵测试：让人和机器进行交流，如果人无法判断自己交流的对象是人还是机器，就说明这个机器有智能了。自然语言发展的两个阶段：1、用电脑模拟人脑；2、基于数学模型和统...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。