solr搜索服务器

1.Solr简介

Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。

特点:Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎

2.Solr的安装配置

1)下载solr安装包(以solr-5.5.4为例)

http://archive.apache.org/dist/lucene/solr/

2)安装:

解压后将solr-5.5.4\server\solr-webapp下的webapp拷贝到LinuxTomcat(版本:apache-tomcat-8.0.44)webapps下并改名为solr

 

 

将解压包solr-5.5.4\server\lib\ext下的jar文件拷到Linuxapache-tomcat-8.0.44/webapps/solr/WEB-INF/lib下:

3)配置solrhome

打开apache-tomcat-8.0.44/webapps/solr/WEB-INFweb.xml文件,找到如下所示去掉注释,将value值设置成你的Linux分词库路径(要先创建好分词库的文件夹index):

 

<env-entry>

   <env-entry-name>solr/home</env-entry-name>

   <env-entry-value>/mysoft/index</env-entry-value>

   <env-entry-type>java.lang.String</env-entry-type>

</env-entry>

 

 

solr-5.5.4\solr-5.5.4\server\solr下的文件和文件夹拷贝到上面web.xml中配置的分词库index下:

 

 

 

在上面已经配好的分词库下创建目录core(core1),将分词库index/configsets/basic_configs下的conf文件夹拷到core1下:

 

 

 

 

开启Tomcat并访问(ipLinux上的IP):http://192.168.6.128:8080/solor/index.html  或者 http://192.168.6.128:8080/solr/admin.html  

 

 

 

 

 

 

 

4配置corecore类似于数据库可以插入多个document(数据库表行)每个document拥有多个 field 数据库的列)

 

 

 

检查 mycore目录 发现多了 core.properties和data两个资源

 



登陆solr管理网站发现 列表中多了core1

 



5)解析配置文件

 


managed-schema 主要用于配置 可以提交到该core的所有field定义,field的类型定义,唯一标识符等

 


 solrconfig.xml 主要用于配置solor的主要配置信息 比如lucene版本 缓存 数据目录 请求路径映射 等

 



6)solr界面添加和查询数据(添加时要根据配置文件中已有的数据类型添加:foodname_ik)

 




 





3.添加IK分词器(solr版本5.5.4,IK最高支持4.7.2,所以要修改源码)

新建一个maven项目,配置pom文件如下所示:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

<modelVersion>4.0.0</modelVersion>

<groupId>cn.et</groupId>

<artifactId>IK</artifactId>

<version>0.0.1-SNAPSHOT</version>

<dependencies>

<dependency>

<groupId>com.janeluo</groupId>

<artifactId>ikanalyzer</artifactId>

<version>2012_u6</version>

<!-- 排除IK4.7.2重新引Lucene5.5.4 -->

<exclusions>

<exclusion>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-core</artifactId>

</exclusion>

<exclusion>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-queryparser</artifactId>

</exclusion>

<exclusion>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-queries</artifactId>

</exclusion>

<exclusion>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-sandbox</artifactId>

</exclusion>

<exclusion>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-analyzers-common</artifactId>

</exclusion>

</exclusions>

</dependency>

<dependency>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-core</artifactId>

<version>5.5.4</version>

</dependency>

<dependency>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-queryparser</artifactId>

<version>5.5.4</version>

</dependency>

<dependency>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-queries</artifactId>

<version>5.5.4</version>

</dependency>

<dependency>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-sandbox</artifactId>

<version>5.5.4</version>

</dependency>

<dependency>

<groupId>org.apache.lucene</groupId>

<artifactId>lucene-analyzers-common</artifactId>

<version>5.5.4</version>

</dependency>

</dependencies>

</project>


 

 



创建跟源码一样的包名和类名并进行修改:

 

 



 

用修改好的文件替换源码:

 



先拷贝ikanalyzer-2012_u6.jar,解压后将上面两个文件替换

 

 

 


 

将改好的jar包放到Linux中的/mysoft/apache-tomcat-8.0.44/webapps/solr/WEB-INF/lib

 

 

 

managed-schema 中配置:

 

 

添加数据,查询数据后分词结果:

 



  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值