- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 数学之美 第4章 谈谈中文分词
数学之美 第4章 谈谈中文分词我们直接进入主题吧!中文分词的演变:1. 第一个中文分词就是 “查字典”方法,就是把句子从左到右顺序扫描一遍,遇到字典里的词就标示出来,遇到复合型词汇就采用最长匹配原则,遇到不认识或者无法分得词汇呢就采用 单字词的模式,这样基本上也覆盖了七八成的中文分词结果了。 唯一的缺点:遇到二义性也就是歧义性的词汇是就无能为力了。
2014-03-20 14:44:01 1282
原创 数学之美 第3章 统计语言模型
数学之美 第3章 统计语言模型回顾一下:前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智能化,因为很多条件制约着我们,而目前比较好的就是统计语言模型,本章开始进入重点:那么什么是统计语言模型呢?1. 统计语言模型:为自然语言发展中的上下文相关特性建立的
2014-03-18 21:41:20 2075
原创 数学之美 第2章 自然语言处理-从规则到统计
数学之美 第2章 自然语言处理-从规则到统计首先我们抛出2个问题:1. 计算机是否能处理自然语言2. 如果能,那么它处理自然语言的方法是否和人类一样--------------------------------------------------------------------------------1. 机器智能图灵
2014-03-18 16:45:22 1967
统计学习方法 李航 著
2014-03-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人