《数学之美》读书记录
《数学之美》第二次阅读
一个学期的结束,考试完成,下起了小雨,吃过了早饭之后,打着伞走进了自习室,重拾此书。记得本学期开学之初初读时欣喜不已,竟放到了现在。
第4章谈谈分词。由于刚刚结束的对数据库的实训须要对SQL语句进行分词,看到本章,感到获益匪浅。词的颗粒度与层次,词表与语言模型,大致地勾勒出了分词器的框架。
第5章隐含马尔可夫模型。记得在好多地方都接触过,翻开此章,终于可以一探究竟了。复杂的问题总是可以通过简单的模型得到描述与解决,每个人都不得不由衷地感叹数学模型之妙。本章从通信模型开始,通过简单的模型马尔科夫假设和独立输出假设推出隐含马尔可夫模型,同时也揭开了自然语言处理、语音识别和机器翻译之间的模型关联性。其中几个算法也使我印象颇深,遗憾自己大学前面两年没有好好学习算法。一个训练算法(鲍姆-韦尔奇算法)、使用时的解码算法(维特比算法)信息的量度和作用。
第6章 本章对“信息”展开讲解。结合信息论,表述了信息熵,互信息,相对熵概念。正如本章开篇的几个问题,我们很难去说清楚信息到底有什么,但书中文字引领我度量信息,量化信息的作用。“信息的作用在消除不确定性,自然语言处理的大量问题就是寻找相关的息。”
2016.7.1