2014年03月_召风

04月 03月

原创数学之美第4章谈谈中文分词

数学之美第4章谈谈中文分词我们直接进入主题吧！中文分词的演变：1. 第一个中文分词就是 “查字典”方法，就是把句子从左到右顺序扫描一遍，遇到字典里的词就标示出来，遇到复合型词汇就采用最长匹配原则，遇到不认识或者无法分得词汇呢就采用单字词的模式，这样基本上也覆盖了七八成的中文分词结果了。唯一的缺点：遇到二义性也就是歧义性的词汇是就无能为力了。

2014-03-20 14:44:01 1282

原创数学之美第3章统计语言模型

数学之美第3章统计语言模型回顾一下：前面两章都是基础知识，告诉我们自然语言的起源基础，和一些发展过程遇到的问题，第二章告诉我们规则：理解自然语言（即分析语句和获取语义）这种处理方法不可能实现智能化，因为很多条件制约着我们，而目前比较好的就是统计语言模型，本章开始进入重点：那么什么是统计语言模型呢？1. 统计语言模型：为自然语言发展中的上下文相关特性建立的

2014-03-18 21:41:20 2075

原创数学之美第2章自然语言处理-从规则到统计

数学之美第2章自然语言处理-从规则到统计首先我们抛出2个问题：1. 计算机是否能处理自然语言2. 如果能，那么它处理自然语言的方法是否和人类一样--------------------------------------------------------------------------------1. 机器智能图灵

2014-03-18 16:45:22 1967

原创数学之美概述

经典书籍《数学之美》总结

2014-03-18 15:14:15 1489

集体智慧编程

是机器学习入门必看书籍，具体章节如下：集体智慧导言，提供推荐，发现群组，搜索与排名，优化，文档过滤，决策树建模，构建加个模型，高阶分类：核方法与SVM

2014-03-18

统计学习方法李航著

统计学习方法，是大牛李航博士大作，是机器学习，数据挖掘，自然语言处理的基础，内含十大算法模型：感知机，K近邻法，朴素贝叶斯，决策树，逻辑斯蒂回归与最大熵模型，支持向量机，提升方法，EM算法及其推广，隐马尔可夫模型，条件随机场，可以说着10个算法你会了，至少是比较厉害点了。

2014-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 数学之美 第4章 谈谈中文分词

原创 数学之美 第3章 统计语言模型

原创 数学之美 第2章 自然语言处理-从规则到统计

原创 数学之美 概述