![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
王小工
java研发工程师、架构师、云计算、大数据
展开
-
1、lucene 简介
是什么 lucene是一款高性能的、可扩展性的信息检索 (IR)工具库。 lucene组件 建立索引步骤: 1、获取内容 通过一些爬虫来获取索引内容。 lucene作为一款核心搜索库,并不提供任何功能来实现内容获取。 目前有大量的开源爬虫软件可以实现这个功能。 开源爬虫软件:1、Solr 2、Nutch 3、Grub 4、Heri原创 2012-03-28 20:48:41 · 550 阅读 · 0 评论 -
2、构建索引
索引过程 主要操作步骤: 1、将原始文档转换成文本 2、分析文本 3、将分析好的文本保存至索引中 基本索引demo package com.lucene; import java.io.IOException; import org.apache.lucene.analysis.WhitespaceAnalyzer; import org.apache.lucene.do原创 2012-03-28 23:23:52 · 459 阅读 · 0 评论