![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Search
文章平均质量分 81
kingjiang
这个作者很懒,什么都没留下…
展开
-
Nutch使用调研报告
这是半年前使用Nutch的时候写的.本文讲述了如何搭建一个可运行的Nutch系统.Nutch是个开源的建立搜索引擎的项目,功能很强大,有时间去研究研究还是很好的.一.Nutch的安装 Nutch的安装比较简单,下面介绍在Linux下的安装步骤:(在Windows下也能运行,不过先得安装cygwin,一个在windows环境下模拟Linux的软件,具体安装步原创 2006-07-20 16:52:00 · 2362 阅读 · 7 评论 -
Lucene倒排索引原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文转载 2006-07-31 16:41:00 · 780 阅读 · 0 评论 -
信息检索及信息过滤方法概述
信息检索及信息过滤方法概述A Survey of Information Retrieval and Filtering Methods1995年Christos Faloutsos and Douglas OardUniversity of Maryland College Park, MD 20742 {christos,oard}@eng.umd.edu中科院计算转载 2006-08-03 17:42:00 · 2740 阅读 · 5 评论