中文分词、全文检索
woodyy
这个作者很懒,什么都没留下…
展开
-
Lucene学习总结
本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。其中总体架构和索引文件格式是Lucene 2.9的,索引过程分析是Lucene 3.0的。鉴于索引文件格式没有太大变化,因而原文没有更新,原理和架构的文章中引用了前辈的一些图,可能属于早期的Lucene,但不影响对原理和架构的理解。本系列文章尚在撰写之中,将会有Java CC, 分词器,QueryParser,查询语句原创 2010-04-05 15:49:00 · 331 阅读 · 0 评论 -
有关Lucene的问题(8):用Lucene构建实时索引的文档更新问题
<br />在有关Lucene的问题(7),讨论了使用Lucene内存索引和硬盘索引构建实时索引的问题。<br />然而有的读者提到,如果涉及到文档的删除及更新,那么如何构建实时的索引呢?本节来讨论这个问题。1、Lucene删除文档的几种方式<br /> IndexReader.deleteDocument(int docID)是用 IndexReader 按文档号删除。 IndexReader.deleteDocuments(Term term)是用 IndexReader 删除包含此词(Term)原创 2010-06-28 12:38:00 · 377 阅读 · 0 评论 -
Lucene 原理与代码分析完整版
<br /> <br />Lucene 原理与代码分析系列文章已经基本告一段落,可能问题篇还会有新的更新。<br /> <br />完整版pdf可由以下链接下载。<br /> <br />Lucene 原理与代码分析完整版 <br /> <br />目录如下:<br /> <br /> 目录<br />目录<br />第一篇:原理篇<br />第一章:全文检索的基本原理<br />一、总论<br />二、索引里面究竟存些什么<br />三、如何创建索引<br />第一步:一些要索引的原文档(Docume原创 2010-06-28 12:40:00 · 412 阅读 · 0 评论 -
Lucene 应用 WordNet 的同义词典实现同义词检索(C#版)
<br />http://www.blogjava.net/Unmi/archive/2010/07/14/326123.html<br /> <br />同义词检索应该很多时候会用得上的,举个简单的例子,我们搜索关键字 good 的时候,与 well 和 fine 等的词条也可能是你想要的结果。这里我们不自己建立同义词库,直接使用 WordNet 的同义词库,本篇介绍 C# 版的实现步骤,还会有续篇--Java 版。<br /><br />由于 Lucene 是发源于 Java,所以 C# 的应用者就没有原创 2010-07-15 08:53:00 · 1595 阅读 · 0 评论 -
jquery高亮显示
<br />http://www.alistspark.com/原创 2010-07-24 11:47:00 · 320 阅读 · 0 评论