自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (9)
  • 收藏
  • 关注

转载 信息检索领域相关资料

zz from http://net.pku.edu.cn/~webg/IR-Guide.txt信息检索领域相关资料 (A Guide to Information Retrieval)Organized by Hongfei YanLast updated on April 19, 2006---------------------Contents        Books          

2006-12-29 13:54:00 4982 2

原创 基于trie树词典 的正向最大切分 分词

基于trie树词典的正向最大切分分词      构建trie树,初始化词典。1.       待分词文本预处理。2.       正向最大切分 查询词典。3.       分词结果。 待分词文本

2006-12-26 17:47:00 2709 2

原创 使用正向最大匹配算法实现中文分词简单模型-用trie树实现

使用trie树来构造字典。 构建词库。扫描词库匹配。Trie树 又称为字典树。Trie树当关键码是可变长时,Trie树是一种特别有用的索引结构。 Trie树的定义Trie树是一棵度 m ≥ 2 的树,它的每一层分支不是靠整个关键码的值来确定,而是由关键码的一个分量来确定。如下图所示Trie树,关键码由英文字母组成。它包括两类结点:元素结点和分支结点。元素结点包含整个key数据;分支结点有2

2006-12-21 17:36:00 7292

原创 Google 黑板报 -- 数学之美 系列

Google 黑板报 -- 数学之美 系列Google 黑板报 -- 数学之美 系列一 -- 统计语言模型 Google 黑板报 -- 数学之美 系列二 -- 谈谈中文分词 Google 黑板报 -- 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用 Google 黑板报 -- 数学之美 系列四 -- 怎样度量信息 Google 黑板报 -- 数学之美 系列五 -

2006-12-21 15:07:00 5550

转载 数学之美 系列二 -- 谈谈中文分词

数学之美 系列二 -- 谈谈中文分词2006年4月10日 上午 08:10:00uT("time114462952509335533");发表者: 吴军, Google 研究员 谈谈中文分词----- 统计语言模型在中文处理中的一个应用上回我们谈到利用统计语言模型进行语言处理,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官

2006-12-21 15:04:00 2456

转载 sizeof 用法总结(转)

sizeof 用法总结(转)sizeof有着许多的用法,而且很容易引起一些错误。下面根据sizeof后面的参数对sizeof的用法做个总结。   A. 参数为数据类型或者为一般变量。例如sizeof(int),sizeof(long)等等。这种情况要注意的是不同系统系统或者不同编译器得到的结果可能是不同的。例如int类型在16位系统中占2个字节,在32位系统中占4个字节。

2006-12-02 17:45:00 1410

转载 高质量C++/C编程指南 -- 第5章 常量

高质量C++/C编程指南 -- 第5章 常量常量    常量是一种标识符,它的值在运行期间恒定不变。C语言用 #define来定义常量(称为宏常量)。C++ 语言除了 #define外还可以用const来定义常量(称为const常量)。5.1 为什么需要常量 如果不使用常量,直接在程序中填写数字或字符串,将会有什么麻烦?(1)       程序的可读性(可理解性)变差。

2006-12-02 17:43:00 748

转载 高质量C++/C编程指南 -- 第6章 函数设计

高质量C++/C编程指南 -- 第6章 函数设计函数设计函数是C++/C程序的基本功能单元,其重要性不言而喻。函数设计的细微缺点很容易导致该函数被错用,所以光使函数的功能正确是不够的。本章重点论述函数的接口设计和内部实现的一些规则。函数接口的两个要素是参数和返回值。C语言中,函数的参数和返回值的传递方式有两种:值传递(pass by value)和指针传递(pass by po

2006-12-02 17:42:00 780

转载 高质量C++/C编程指南 -- 第7章 内存管理 (1)

高质量C++/C编程指南 -- 第7章 内存管理 (1)程序员们经常编写内存管理程序,往往提心吊胆。如果不想触雷,唯一的解决办法就是发现所有潜伏的地雷并且排除它们,躲是躲不了的。本章的内容比一般教科书的要深入得多,读者需细心阅读,做到真正地通晓内存管理。7.1内存分配方式内存分配方式有三种:(1)       从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内

2006-12-02 17:41:00 989

转载 高质量C++/C编程指南 -- 第10章 类的继承与组合

高质量C++/C编程指南 -- 第10章 类的继承与组合对象(Object)是类(Class)的一个实例(Instance)。如果将对象比作房子,那么类就是房子的设计图纸。所以面向对象设计的重点是类的设计,而不是对象的设计。对于C++程序而言,设计孤立的类是比较容易的,难的是正确设计基类及其派生类。本章仅仅论述“继承”(Inheritance)和“组合”(Composition)的概念。

2006-12-02 17:36:00 1073

转载 高质量C++/C编程指南 -- 第7章 内存管理 (2)

高质量C++/C编程指南 -- 第7章 内存管理 (2)7.7 杜绝“野指针”“野指针”不是NULL指针,是指向“垃圾”内存的指针。人们一般不会错用NULL指针,因为用if语句很容易判断。但是“野指针”是很危险的,if语句对它不起作用。“野指针”的成因主要有两种:(1)指针变量没有被初始化。任何指针变量刚被创建时不会自动成为NULL指针,它的缺省值是随机的,它会乱指一气

2006-12-02 17:35:00 881

转载 高质量C++/C编程指南 -- 第8章 C++函数的高级特性

高质量C++/C编程指南 -- 第8章 C++函数的高级特性第8章 C++函数的高级特性对比于C语言的函数,C++增加了重载(overloaded)、内联(inline)、const和virtual四种新机制。其中重载和内联机制既可用于全局函数也可用于类的成员函数,const与virtual机制仅用于类的成员函数。重载和内联肯定有其好处才会被C++语言采纳,但是不可以当成免费的午餐而滥用。本章

2006-12-02 17:33:00 909

原创 (转)关于继承,不同继承方式,对于派生类成员以及基类的可见性

通过继承机制,可以利用已有的数据类型来定义新的数据类型。所定义的新的数据类型不仅拥有新定义的成员,而且还同时拥有旧的成员。我们称已存在的用来派生新类的类为基类,又称为父类。由已存在的类派生出的新类称为派生类,又称为子类。  在C++语言中,一个派生类可以从一个基类派生,也可以从多个基类派生。从一个基类派生的继承称为单继承;从多个基类派生的继承称为多继承。  派生类的定义格式  单继承的定义格式

2006-12-02 17:28:00 1932

Packtpub.Solr.1.4.Enterprise.Search.Server.Aug.2009.pdf

Packtpub.Solr.1.4.Enterprise.Search.Server.Aug.2009 最权威的solr书籍 英文版pdf

2010-10-09

企业级solr入门

企业级solr入门

2010-10-09

myhout in action

myhout in action.pdf

2010-09-17

经典模式分类 ppt

author duda 经典教材 pattern classification ppt

2009-11-14

Pattern_classification 模式分类

经典的模式识别教程 Pattern_classification 模式分类 pdf

2009-06-08

研究生教材清华大学矩阵论习题解答

清华大学矩阵论习题解答研究生教材清华大学矩阵论习题解答研究生教材清华大学矩阵论习题解答

2009-02-25

高质量c编程指南(pdf)

高质量c编程指南(pdf)

2007-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除