Solr及Spring-Data-Solr入门学习

Solr的安装与配置

多数搜索引擎应用都必须具有某种搜索功能,而搜索功能往往大量的消耗资源导致应用程序运行缓慢。为此,出现了各种用于构建搜索的应用程序,我们要学习的solr正是其中的一款开源搜索平台。

Apache Solr 是建立在Lucene(全文搜索引擎)之上,帮助我从大量的数据中寻找所需信息。不仅限于搜索,Solr也可用于储存目的。像其他NoSQL数据库一样,它是一种非关系数据储存和处理技术。

下面我们开始喜闻乐见的手摸手教学,教你优雅的整合SSM框架和Solr搜索框架。

  • 项目开源地址: Github

项目中使用了SSM + Shiro + Redis + Solr + Vue.JS + ElementUI技术,优雅的整合了SSM框架阶段几个常见的企业框架;并用Vue.js + ElementUI写了超漂亮的前端页面;如果觉得可以,就点亮右上角star吧(#.#)。

如果你对Shiro+用户-角色-权限整合不是很懂,你或许可以看下我的这个项目: 手摸手教你SSM整合Shiro框架后的开发

日常学习记录,如果想支持我,希望能在Github上看到你点亮的星星(#.#)。



安装

Apache Solr官网 下载最新版的Solr,在 Apache Tomcat官网 下载Tomcat。

解压solr,发现其中有如下目录结构

image

新版本的Solr和老版本的不同,老版本中直接提供的是war文件,新版本则是提供了直接可运行的项目;其次需要导入项目中的的文件也有所不同的。下面我们介绍一下完整的配置和Solr项目的启动:

  • 1、将solr-7.4.0/server/solr-webapp/下的webapp文件夹拷贝到Tomcat下的webapps目录下(并重命名为solr)。
  • 2、将solr-7.4.0/server/lib/ext/下的所有Jar文件全部拷贝到Tomcat下webapps/solr/WEB-INF/lib目录下。
  • 3、将solr-7.4.0/server/lib下所有metrics开头的jar文件全部拷贝到webapps/solr/WEB-INF/lib目录下。
  • 4、将solr/7.4.0/server/solr文件夹复制到任意一个位置并重命名为solrhome
  • 5、修改tomcat/webapps/solr/WEB-INF/web.xml文件的第41行,指定solrhome所在的目录。

image

  • 6、在webapps/solr/WEB-INF/web.xml下的第125行出添加注释,也就是注释<security-constraint></secirity-constraint>节点下的配置。

image

  • 7、启动Tomcat,在浏览器中访问http://localhost:8080/solr/index.html即可访问到solr Admin

image

如上所示,你会发现其左下角显示的是No cores,这和老版本的可能又有所差别,所以我们点击No cores,创建一个新的cores,那么会在我们指定的solrhome文件夹内产生一个new_core的空文件夹,并且页面会报错:Can't find resource 'solrconfig.xml' in xxx,表示的就是在这个新core下的conf文件夹下没有找到solrconfig.xml文件:

image

image

我们需要将复制来的configsets/_default/conf这个文件夹(或者solr-7.4.0/server/solr/configsets/_default/conf文件夹)复制到solrhome/new_core/文件夹下。

  • 8、重启Tomcat服务器,发现还是没有出现新的core,点击No cores那里点击add core,此时就会完整的创建一个新的core,在solrhome/new_core文件夹下会生成新的文件:

image

  • 至此Solr已经安装完成。

中文分词器

上面我们成功的安装了solr,下面就要进行相关的配置。因为solr是一个开源的搜索平台,主要功能就是把用户输入的搜索信息分类汇总并进行数据库的查询,而中文众所周知语义比较复杂,而且中文所占的字节和英文也有所不同,所以就出现了中文分词器,实现模拟中文语义对数据进行分词衍化。IK Analyzer正是其中的一种分词器。

IK Analyzer在solr工程中的配置如下:

  • 1、下载ikanalyzer相关配置文件,因为Maven仓库中的ikanalyzer版本太老,solr5以上的版本都不支持,所以这里提供一个新版本: 传送门
  • 2、将下载的jar文件copy到webapps/solr/WEB-INF/lib文件夹下
  • 3、在webapps/solr/WEB-INF/下创建classes文件夹,将上面下载的文件夹中的ext.dicIKAnalyzer.cfg.xmlstopword.dic三个文件复制到webapps/solr/WEB-INF/classes/文件夹下。
  • 4、在solrhome/conf/目录下我们发现并没有schema.xml文件,这和老版本又有所不同,老版本直接生成好了schema.xml文件,在新版本中我们可以发现/conf文件夹中存在一个managed-schema文件,这个其实就是我们要的schema.xml文件。但是我们又不能直接用,具体原因参考 博文
  • 5、直接将managed-schema文件重命名为schema.xml。并在schema.xml的最后添加<fieldType>节点:
<fieldType name="text_ik" class="solr.TextField">
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
  • 6、重启Tomcat服务器,重新访问项目,点击new_core下的Schema功能,在select下拉框中输入text_ik如果出现刚创建的text_ik,说明IK中文分词器安装成功。

image

测试

未使用分词器效果:

image

使用了分词器的效果显而易见:

image


配置域

solr和其他NoSQL数据库一样可以实现数据存储,所以我们可以以数据库的思想想象一下solr,之前我们新创建的core就类似一个数据库,那么下面要配置的就相当于数据库的表字段,因此要手动的去定义系统中需要的字段Field(域)。

通常我们创建的一种Field分别对应这一类数据,用户对同一种数据进行相同的操作。域常用的属性有:

  • name: 指定域的名称
  • type: 指定域的类型
  • indexed: 是否索引
  • stored: 是否储存
  • required: 是否必须
  • multiValued: 是否多值

域的介绍

如上面的介绍,类似数据库中的表字段,而我们做项目时数据库的字段都是根据项目需求创建的,所以也是如此,它是根据搜索平台需要搜索的信息对应的数据库表字段来创建的。

比如,在淘宝商城购买商品,我们可能会搜索:1、品牌(对应数据库中brand字段);2、价格(对应数据库中price字段);3、商品介绍名称(对应数据库中title字段)等等…

每一中域(字段)都用<field>字段设定,比如如上的搜索数据,我们可以设置为:

<field name="item_title" type="text_ik" indexed="true" stored="true"/>
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值