《数学之美》——第二章 个人笔记

原创 2018年04月17日 14:25:34

                                           数学之美

最近在读《数学之美》这本书,做一下个人笔记。看的是PDF,看完后会买一本的哦!版权意识还是有的。

ps:图片文字都是这本书中的内容,侵权立删。会有点自己的理解。

第二章    自然语言处理——从规则到统计

这一章开头这句话:字母,文字,数字是信息编码的不同单位。任何一种语言都是一种编码的方式,而语言的语法规则是编解码的算法。我们表达一个意思要通过语言表达出来,就是用这种语言的编码方式表示出来,结果就输出一串文字。别人懂这门语言的编码方式,就会理解。这里说的输出一串文字,可以是字母,数字(计算机理解),和开头说的信息编码的不同单位是符合的,就很好理解了。这就是语言的数学本质。

⭐①计算机能处理自然语言

⭐②它处理自然语言的方法和人类一样


1 机器智能

有意思的词:‘鸟飞派’:看看鸟是怎么飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。

下图是前人对自然语言处理的想法(走的弯路)


单纯基于文法规则的分析器是处理不了复杂的语句的,里面有两个不可逾越的坎儿:

①文法规则的数量太庞大,无法构建;写到后面还会出现矛盾

②描述自然语言的文法和计算机高级程序语言的文法是不同的,计算机难以解析。作者在这里提到了自然语言在演变过程中产生了词义上下文相关的特性;对于上下文无关文法,算法的复杂度是语句长度的二次方,而对于有关文法,则是六次方。


2 从规则到统计

有趣的例子:The pan is in the box ,The box is in the pen 。这个栗子说明了语义的难处理。再有统计语言学的出现,不久后NLP从规则到统计。

PS:文中有一段讲斯伯格特对未来研究方向的判断,总让我觉得大牛都是开挂的。还有传统捍卫者的武器就是基于统计的方法只能处理浅层的NLP问题。


3 小结

基于统计的NLP方法,在数学模型上和通信是相通的,甚至就是相同的。因此,在数学意义上NLP又和语言的初衷——通信联系在一起了。(这里基于统计的方法是让计算机能够处理NL




3D数学在Unity中运用

-
  • 1970年01月01日 08:00

数学之美阅读笔记(1)

大一的时候就开始看吴军博士第一版的《数学之美》,苦于那时年少无知不懂事,加上自身数学知识的体系不健全,翻着翻着也就没有了后文。现在读了研究僧,也许是换了个视野,看到书的开头“中国教育最失败的就是学生从...
  • u011826404
  • u011826404
  • 2017-04-21 14:54:02
  • 426

数学之美读书笔记

第一章:文字和语言vs数字和信息     1. 文字是信息的载体。信息传播的基本模式:             源信息 -> 编码 -> 信道传输 -> 接收者解码 -> 还原信息     2....
  • mlzhu007
  • mlzhu007
  • 2014-07-10 19:04:25
  • 1824

数学之美学习笔记

16年一月份阅读了吴军的《数学之美》,真有种相见恨晚的感觉!对于刚刚学习自然语言处理的人来说,这是最佳入门读物,没有之一。下面是我在学习中做的一些知识点的阅读笔记,有些内容、公式摘自Tomas M.C...
  • u010161379
  • u010161379
  • 2016-02-22 15:11:21
  • 953

数学之美学习笔记(1)

第1章    文字和语言vs数字和信息 文字按照意思来聚类,最终回带来一些歧义。上下文建立的概率模型也会出现错误。 罗塞塔石碑对自然语言处理的两点指导意义: 1.      信息的冗余是信息安全...
  • u010963351
  • u010963351
  • 2016-01-14 10:03:39
  • 249

数学之美-读书笔记

第一章:文字和语言 vs 数字和信息 文字增长到一定数量就不再增加,因为人们记不住辣么多,便开始归纳和总结,一字多义;遇到歧义怎么办?上下文。 如果不同语言之间要交流文明,这就需要翻译。翻译的理论基础...
  • u010745111
  • u010745111
  • 2016-09-20 10:49:04
  • 188

【读书笔记】《数字图像处理》(第三版)-第2章 数字图像基础

《数字图像处理》的第二章,主要讲了图像的一些定义,数字图像处理的基本概念和方法。本章节为后面做具体处理提供了最基本的概念。...
  • u014556728
  • u014556728
  • 2016-09-13 21:33:27
  • 451

数学之美--个人笔记

10、PageRank 又称,Google的民主表决式网页排名技术。——衡量网页质量的方法 PageRank算法的原理: 便于理解,我引用书上的一个例子:比如我们要找李开复博士,那么有100个人...
  • qq_41634283
  • qq_41634283
  • 2018-04-09 17:17:44
  • 3

数学之美读后感

1、自然语言处理研究的"鸟飞派"认为看看鸟怎么飞,就能模仿鸟造出飞机,而不需要了解空气动力学。事实是,怀特兄弟靠的是空气动力学而不是仿生学。 串想: 有那么很少一些的初级投资者们,认为看看巴菲特怎...
  • huaweitman
  • huaweitman
  • 2014-06-23 10:48:00
  • 3202

数学之美 第二版 清晰扫描版.pdf下载

  • 2017年10月28日 16:34
  • 49.5MB
  • 下载
收藏助手
不良信息举报
您举报文章:《数学之美》——第二章 个人笔记
举报原因:
原因补充:

(最多只允许输入30个字)