《数学之美》-第二章-自然语言处理-从规则到统计

语言的数学本质

字母、文字和数字实际上是信息编码的不同单位。任何一种语言都是一种编码方式,语言的语法规则就是编解码的算法。
编码:我们把要表达的意思通过某种语言的一句话表达出来。解码:对方懂这门语言,通过这门语言的解码方法获得说话人想要表达的信息。

机器智能

图灵测试(Turing Test): 验证机器是否有智能的方法是,让人和机器交流,如果人无法判断自己交流的对象是人还是机器,那么机器就具有智能。
自然语言处理分为两个阶段:第一阶段用电脑模拟人脑(类似于仿生学),成果近乎为0;第二阶段基于数学模型和统计的方法,取得了进展。
早期的研究主要是在“句法分析”和“语义分析”两方面。在句法分析上,科学家们通过构造语法分析树、文法分析器(Parser)分析句子的句法。存在两个方面的问题:1,文法规则的数量不仅庞大, 而且会逐渐增加,甚至会产生矛盾;2,自然语言中有词义和上下文相关的特性,计算量非常非常大。(Context Dependent Grammar)
在语义处理上,遇到了更大的麻烦:多义性严重依赖上下文甚至是常识等等问题。

从规则到统计

基于统计方法的核心是通信系统隐含马尔可夫模型
只有基于有向图的统计模型才能很好地解决复杂的句法分析。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值