solr–安装及基本使用
文章目录
一、solr简介
solr是以文本为中心,面向文档的搜索引擎。底层采用lucene建索引。
二、solr使用场景
2.1 文本搜索
由于solr擅长于文本处理,因此solr擅长大数据量的文本搜索。
2.2 缓存
由于solr具有内存缓存,可将最近查询数据保留在内存中,便于下次查询,因此,也可将solr用于缓存。solr的默认缓存置换算法是LRU(least recently used),即最近最久未使用算法。
三、solr构成
solr主要包括两部分,solr主目录和web应用。
3.1 solr主目录(solr存放core的目录)
solr主目录里是根据需要建立的一个个core,一个core代表了一类文档的集合collection(可以理解为数据库中的表),里面定义了文档的字段(可以理解为数据库表中的字段)。core位于server/solr目录下,主要包含conf目录(里面是配置文件)和data目录(主面是索引等数据),以及core.properties文件(当前core的属性)。
3.2 web应用
用于启动solr及在上进行查询等操作。
四、core的主要配置文件
以建立名称为stu的core为例,其配置文件在server/solr/stu/conf目录中,主要有schame.xml配置文件、managed-schema(和schame.xml一样,通常用这个即可,不用schame.xml)配置文件和solrconfig.xml配置文件。
4.1 managed-schema配置文件
managed-schema(schame.xml功能与此一样的)定义当前core的索引结构,即是自己需要的字段(可以理解为数据库表内的字段),同时里面还包含了字段类型定义等信息。
4.2 solrconfig.xm配置文件
solrconfig.xm定义了当前core的主要配置,包括各种处理器。
五、安装和启动步骤
安装和启动步骤如下:
1. 下载solr:wget https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/7.2.0/solr-7.2.0.tgz
2. 解压后放到安装目录,并进入solr目录
3. 进入solr的core目录:cd server/solr/
4. 启动solr:bin/solr start -p 8983
5. web页面查看,打开浏览器页面,输入地址http://127.0.0.1:8983,即可看solr已经正常启动了。
六、新建core步骤
这里以新建core的名称为stu为例,步骤如下:
-
进入solr的core主目录:cd server/solr
-
创建新core的目录stu:mkdir stu
-
复制core的默认配置: cp -r configsets/sample_techproducts_configs/conf stu/
-
加载新建的core
打开浏览器页面,输入地址http://127.0.0.1:8983
点左侧Core Admain,在右侧输入新建core的名称stu、目录stu,其它的默认即可
最后点击Add Core,新建core就完成了。
此时在左侧Core Selector下拉框即可看见新的stu。
- 定义core的索引结构
在stu目录下,再进入conf目录,修改managed-schema文件,删除用于示例的field类型(但field的name为_version_、root、text、text_rev保留,这是solr默认需要的)
和copyField类型的字段,根据自己需要添加stu的索引字段。
字段内容示例如下:
<field name="id" type="string" multiValued="false" indexed="true" required