- 目标1:完成solr环境安装、中文分析器和业务域的配置
- 目标2:会使用Spring Data Solr完成增删改查操作
- 目标3:完成批量数据导入功能
- 目标4:完成按关键字搜索功能
一.Solr安装与配置
Apache Solr是一个流行的开源搜索服务器,它通过使用类似REST的HTTP API,这就确保你能从几乎任何编程语言来使用solr。
Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。
安装前提: 安装了jdk 在1.8以上
solr 选择7.0+版本! 4.0版本 需要集成Tomcat 操作起来比较麻烦! 8.0版本又会出现版本兼容的问题!
1. Solr安装
a.下载solr wget http://archive.apache.org/dist/lucene/solr/7.4.0/solr-7.4.0.tgz
(在linux中安装)
b. tar -zxvf solr-7.4.0.tgz
,解压 solr。
bin是solr运行的脚本
contrib是solr的一些插件,用于扩展solr的功能
dist该文件夹下包含build过程中产生的war和jar文件,以及相关的依赖文件
doc:solr的文档
example:solr官方提供的一些示例程序,简要介绍几个示例
licenses:solr相关的一些许可信息
server:solr的运行实例工程
c. solr 添加环境变量 方便快速启动 等操作
vim /etc/profile
export SOLR_INSTALL_HOME=/usr/shihao/solr-7.4.0
export PATH=$SOLR_INSTALL_HOME/bin:$PATH
source /etc/profile
(使用配置生效)
d.启动solr
- solr start
- solr restart
- solr stop
例:solr start -p 9999 -force
指定端口启动
系统因安全问题考虑,可能需要在命令后加上-force参数
二solr7.4 配置ikanalyzer
- ik 下载地址:
https://search.maven.org/
– 搜索 com.github.magese
- 将下载好的jar包放入solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib目录中
cd 至 /solr-7.4.0
mkdir server/solr/ik
cp -r server/solr/configsets/_default/conf server/solr/ik/
- 然后到server/solr/ik/conf目录中打开managed-schema文件,增加如下代码
<!--ik 分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>