专门开个分类记录书籍数学之美中的文章。标题带数学之美的文章,其内容摘录自吴军著《数学之美》
字母、数字和文字其实是信息编码的不同单位:如果人脑中的思维是语义信息的话,那么语法规则就是编解码的算法,把思想用语言编码一次说出来,被听者再使用这门语言解码得到蕴含的信息。这跟计算机处理自然语言非常类似。
早些年研究人员试图使用计算机模拟人脑,结果一无所获。直到找到基于数学模型和统计的方法,自然语言处理才进入到第二阶段。早期研究人员认为要想理解自然语言首先需要分析语句,然后获取语义。因此试图使用传统语言的语法规则分析自然语言。这与编译器中上下文无关法非常近似。但是不同的是高级程序语言是人为制定的,且包含的文法有限。而在自然语言中仅是一个简单语句就需要及其复杂的语法树来分析。而且自然语言高度依赖上下文。如“the
pen is in the box”和“the box is in the pen”就是完全不同的涵义。