定义:是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
**
Lucene
**
Lucene是Apache提供的一个开源的全文检索引擎工具包,其本质就是一堆jar包而已,而非一个完整的搜索引擎,但我们可以通过Lucene来构建一个搜索引擎。
**
API详解
**
indexWriter:索引写入器对象
Directory:目录类,用来指定索引库的目录
IndexWriterConfig:索引写入器的配置类
Document:文档
**
IK分词器
**
支持对自定义词库,其可以定义两个扩展的词典
(1)扩展词典(新创建词功能):有些词IK分词器不识别。
(2)停用词典(停用某些词功能)有些词不需要建立索引
**
查询API
**
TermQuery:词条查询
WildcardQuery:通配符查询
FuzzyQuery:模糊查询
NumericRangeQuery:数值范围查询
BooleanQuery:组合查询
**
Solr
**
Solr是一个独立的企业级应用搜索服务器,如果想要连接这个服务器需要发送http请求,solr是基于lucene来实现的。
**
Solrj
**
solrj是Apache官方提供的一套java开发的,用于操作solr服务的API,通过这套API可以让java程序与服务进行交互,让java程序可以直接操作solr服务进行增删改查。
solrj的官网网址: https://wiki.apache.org/solr/Solrj
标准的javaBean对象需要满足什么条件?
(1)成员属性必须私有化
(2)必须给成员属性提供get和set方法
(3)必须提供午餐的构造方法
(4)实现序列化接口