读吴军博士的《数学之美》

中秋国庆长假,什么地方都没去,只是静静呆在家里读书和写东西。所读的书种类不多,但却给我带来深刻的思考。

  如何给语言文字建立数学模型,一直是我既感兴趣又觉得无从设想因而深感困惑的领域(关心这个领域不是我的工作,只是出于兴趣)。吴军博士的《数学之美》给我解了惑。以下是我的读后感:

  一、计算机或曰电脑,在处理文字时,并不是在思考什么,更不是在欣赏什么,只是在计算,高速地计算!至少到目前为止,不是在计算的电脑还没有被研制出来。

  二、在如何为电脑处理文字信息提供合适的数学模型这个问题上,曾经有两类思路,一是基于语法规则,另一是基于语料库统计。两者竞争的结果是后者大胜于前者。这个赛果大大出乎深信严格性并信奉“上帝不掷骰子”的很多科学工作者所料,统计模型的这种有效性同样也大大出乎我之所料。我猜想,基于语法规则的方法之所以失败,可能是源于这种方法在面对几乎无限丰富的语言文字信息时会带来分析上的“组合爆炸”。统计方法的成功,则在于其“系综化”地处理语言的位序信息,从而避免了“组合爆炸”的发生。

  三、书中介绍的TF-IDF方法,本质上是一种实用主义的方法(因而不是理想主义的方法),数学上是自映射的,自指的,内生的,是一种典型的“分析-综合”兼备的方法。在辩识出规则之前,没有人为的、先验的东西,一切规则的发掘都源于统计的发现,规则被“发现”之后反过来成了分类、排序的“依据”。

  四、书中介绍的最大熵模型,以前在读理论地理学时接触过,形式上很吓人,一长串的指数,但对其要描述事物的本质还是不甚清晰的。吴博士的讲述让我有一种醍醐灌顶的感觉。哦,其实它本质上是极为简单的,也就是我们在日常生活中会常常运用的常识:你若对一件事可能出现的结果完全无知(完全!),你就将各种可能性假设为等概率就成了。这个假设在处理语言文字信息中,也有着超乎常理的有效性。我猜想,其有效性的根源在于语言信息的极度丰富性(而不是其规则性)而令到你其实更接近于“无知”。

  五、图论在处理语言信息中的作用主要是分析性的,其功能是清晰化语素之间关系的有或无,关系的强度则由统计模型给出。我在十年前的MBA毕业论文中就大致是这样运用图论的,所以这种思路读来特别的亲切。

  六、余弦定理在文字信息比较中的应用令人叹为观止!读完第14章《余弦定理和新闻的分类》之后,我甚至觉得这个工具原则上是可以用于任何事物之间作定量比较的。人与人、物与物、作品与作品、理念与理念、制度与制度、地区与地区、......等等等等。

  七、关于学习的本质,读完这本书我又有了新的认识上的提高。学习有几个要点:一是要有“见识”,在语言文字信息处理问题上就是要有不断更新的语料库;二是要善于“总结”,在这里就是要运用统计手段去发现规律(规则);三是不能“守旧”,要承认规则是动态的,也就是要不断总结,不能“一本通书读到老”;四是要调整系统的“行为”,要按动态的规则去处理信息。总结之下,学习就是“长见识、善总结、弃守旧、调行为”的四步过程的统一体,缺一不可!

  八、书中介绍的“期望最大化算法”,原则上也是可以用于对任何事物的无先入之见的分类方法,连分类结构本身都能在分类运算中迭代完成,怪不得被称为“上帝的算法”。但对如何形成分类结构我还没读懂,不知能向谁请教。

  九、书的文字风格也是我极喜欢的,吴博士说,是两本书在影响着他的写作,一是伽莫夫的《从一到无穷大》,另一是霍金的《时间简史》。我说怪不得,我也是这两本书及作者的粉丝呢。

  一气呵成就写这么多了。总之,这是一本完美的书!

数学之美》是作者吴军博士创作的一本关于数学的书籍。在这本书中,吴军博士通过重写文章,将高深的数学原理讲解得更加通俗易懂,让非专业者也能领略数学的魅力。者可以通过具体的例子学习思考问题的方式,学会如何化繁为简,如何用数学去解决工程问题,以及如何跳出固有思维不断去思考创新。这本书曾在谷歌黑板报上发表,获得了上百万次点击,并得到者的高度评价。者反馈说,在阅数学之美》后,他们发现大学时学的数学知识,如马尔可夫链、矩阵计算以及余弦函数等,都变得更加亲切和生动,同时也发现了自然语言和信息处理的有趣之处。 很遗憾,没有找到《数学之美》的具体PDF版本的信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [数学之美 (第二版) pdf](https://blog.csdn.net/weixin_30817749/article/details/95759046)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [经典计算机图书:之美系列](https://blog.csdn.net/qq_35764955/article/details/70194584)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值