自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

向往未来

今日我以小蛇入住,他日定以巨龙腾出!

  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

原创 数学之美 第4章 谈谈中文分词

数学之美  第4章  谈谈中文分词我们直接进入主题吧!中文分词的演变:1.  第一个中文分词就是  “查字典”方法,就是把句子从左到右顺序扫描一遍,遇到字典里的词就标示出来,遇到复合型词汇就采用最长匹配原则,遇到不认识或者无法分得词汇呢就采用 单字词的模式,这样基本上也覆盖了七八成的中文分词结果了。  唯一的缺点:遇到二义性也就是歧义性的词汇是就无能为力了。

2014-03-20 14:44:01 1280

原创 数学之美 第3章 统计语言模型

数学之美 第3章 统计语言模型回顾一下:前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智能化,因为很多条件制约着我们,而目前比较好的就是统计语言模型,本章开始进入重点:那么什么是统计语言模型呢?1. 统计语言模型:为自然语言发展中的上下文相关特性建立的

2014-03-18 21:41:20 2075

原创 数学之美 第2章 自然语言处理-从规则到统计

数学之美 第2章  自然语言处理-从规则到统计首先我们抛出2个问题:1. 计算机是否能处理自然语言2. 如果能,那么它处理自然语言的方法是否和人类一样--------------------------------------------------------------------------------1. 机器智能图灵

2014-03-18 16:45:22 1966

原创 数学之美 概述

经典书籍 《数学之美》 总结

2014-03-18 15:14:15 1488

集体智慧编程

是机器学习入门必看书籍,具体章节如下:集体智慧导言,提供推荐,发现群组,搜索与排名,优化,文档过滤,决策树建模,构建加个模型,高阶分类:核方法与SVM

2014-03-18

统计学习方法 李航 著

统计学习方法,是大牛李航博士大作,是机器学习,数据挖掘,自然语言处理的基础,内含十大算法模型 :感知机,K近邻法,朴素贝叶斯,决策树,逻辑斯蒂回归与最大熵模型,支持向量机,提升方法,EM算法及其推广,隐马尔可夫模型,条件随机场,可以说着10个算法你会了,至少是比较厉害点了。

2014-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除