数学
Bug面壁者
ios开发,工作半年,自动化打包、增量编译、热修复略有涉猎,欢迎讨论!
展开
-
《数学之美》 第一章 文字与语言VS数字和信息
通信模型: 信息源编码发出信息→信道传递信息→接受者解码接受信息 语言和词汇增多→文字产生(基于高效记录信息的需求)→概念开始概括和归类 概念的聚类原理上与自然语言的处理或者机器学习的聚类有很大的相似性。 一词多义→产生歧义→根据上下文消除歧义 罗塞塔石碑的启示: 信息的冗余是信息安全的保障;双语或者多语的对照语料对翻译至关重要,是从事机器翻译研究的基础。原创 2017-11-29 23:43:41 · 378 阅读 · 0 评论 -
《数学之美》 第二章 自然语言处理——从规则到统计
语言的数学本质: 语言的出现是为了人类之间的通信;字母、笔画、文字、数字实际上是信息编码的不同单位,而语言的语法规则则是编解码的算法。 计算机出现之后,希望计算机处理自然语言。计算机处理自然语言的方法和人类一样通过接受信息、解码来处理自然语言。 机器智能: 计算机之父阿兰·图灵最早提出机器智能。 图灵测试: 让人和机器进行交流,如果人无法原创 2017-12-01 10:07:32 · 540 阅读 · 0 评论 -
《数学之美》第三章 统计语言模型
计算机处理自然语言,一个基本的问题就是为自然语言这种上下文相关的特性建立数学模型,即统计语言模型。这是今天所有自然语言处理的基础,并被广泛应用。 用数学的方法解释语言规律: 贾里尼克 的统计模型:一个句子是否合理,就看他的可能性大小如何。更严格地描述:假定S表示某一个有意义的句子,由一连串特定排序的词w1,w1...,wn组成,要想求得S在文本中出现的概率P(S),有P(S)=P(w1,w原创 2017-12-01 22:16:25 · 855 阅读 · 0 评论