一、 Solr
1. 什么是全文检索?
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
2. 简单介绍一下什么是solr?
Solr它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索(就是统计)、命中醒目显示并且支持多种输出格式(包括XML/XSLT 和JSON等格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。可以使用 Solr 的表现优异的基本搜索功能,也可以对它进行扩展从而满足企业的需要。Solr的特性包括:
3. • 高级的全文搜索功能
专为高通量的网络流量进行的优化
基于开放接口(XML和HTTP)的标准
综合的HTML管理界面
可伸缩性-能够有效地复制到另外一个Solr搜索服务器
使用XML配置达到灵活性和适配性
可扩展的插件体系
Lucene与solr的关系是什么?
Solr与Lucene 并不是竞争对立关系,恰恰相反Solr 依存于Lucene,因为Solr底层的核心技术是使用Lucene 来实现的,Solr和Lucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是独立的应用程序,而Solr是。Lucene专注于搜索底层的建设,而Solr专注于企业应用。Lucene不负责支撑搜索服务所必须的管理,而Solr负责。所以说,一句话概括 Solr: Solr是Lucene面向企业搜索应用的扩展
4. Solr的核心配置文件是哪个?简单列举里面有哪些内容,代表什么意思?
域 field 当中也type 域的类型 index是否参与检索 ,store是否返回
Copy 域 name拷贝域的名字 desc目标域的名字
在检索的时候指定copy域 他会去copy域当中的两个域去检索,方便检索
5. 说一说solr的索引机制
全量索引和定时索引
6. 常用的中文分词器有哪些?
7. 为什么需要solr集群?solr集群如何搭建?
商品检索功能,很多用户都会访问,有一定的并发量。需要大规模分布式索引和检索能力。这个时候就需要solr集群。使用zookeeper作为solr集群的配置信息中心。