1.1、什么是Lucene
LOGO:
l Lucene是一套用于全文检索和搜寻的开源程序库,由Apache软件基金会支持和提供
l Lucene提供了一个简单却强大的应用程序接口(API),能够做全文索引和搜寻,在Java开发环境里Lucene是一个成熟的免费开放源代码工具
l Lucene并不是现成的搜索引擎产品,但可以用来制作搜索引擎产品
l 官网:http://lucene.apache.org/
1.2、什么是全文检索?
计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式
什么是全文检索? ==> 全部都搜索 ==> 如何实现全部都搜索? ==> 分词 单词永不重复 单词就是索引 单词是最小的搜索单位
倒排索引
总结:对文档(数据)中每一个词都做索引。
1.3、Lucene下载及版本问题
官网:
l 目前最新的版本是6.x系列,但是大多数企业中依旧使用4.x版本,比较稳定。本次课程我们使用4.10.2版本
1.4、Lucene与Solr的关系
Lucene:底层的API,工具包
Solr:基于Lucene开发的企业级的搜索引擎产品
转载于:https://blog.51cto.com/13587708/2400476