2、solr与tomcat及中文分词的整合

原创 2013年12月04日 21:54:20

1、将solr中的example中的solr拷贝到要作为服务器的位置,这里是放在D:\lucene\solr\home

这个文件夹是专门来存放solr的数据的


2、将solr相应的web程序也拷贝出来

这里是在solr文件夹下面新建一个server文件夹,存放web程序


3、修改solr下面的home文件夹下面的solrconfig.xml设置data的路径


Solrconfig.xml里面的


可以把该路径放到环境变量里面,然后用$符号来引用环境变量

 

4、设置相应的tomcat的context



5、为context设置相应的环境变量,说明solr的主目录的地址



6、启动tomcat的服务器,访问http://localhost:8080/solr/,界面如下所示


以后使用solrj的话都要启动solr的服务器才能进行使用,因为solrj就是通过服务器请求返回结果数据的

 

7、取消VelocityResponseWriter的输出格式,

该配置在D:\lucene\solr\home\conf的solrconfig.xml里面


8、solr把我们所有能用到的域全部放到了schema.xml中了

路径为:D:\lucene\solr\home\conf的schema.xml

对于solr而言,id只能是唯一的,而在lucene中可以是不唯一的,如果你要把一篇文档加入到solr中,那你必须有id


9、在solr中增加对ik中文分词器的支持

9.1、把ik分词器的jar包拷贝到solr的服务器的lib目录下


9.2、将中文分词添加到FieldType中

它其实就是定义了一组类型,该类型使用了哪个分词器


9.3、在服务器页面中查询分词效果,点击


进入该页面。





Spring之——多Service实现的引用方式(插曲)

今天,给大家带来一篇在如何在同一controller中引用同一spring service接口的不同实现类,作为小小的笔记分享给大家,好了,不多说了,大家直接看下面的代码就能明白了,粘贴代码,走起: ...

多线程的小知识点

1、++i不是原子性的,它是由三个步骤组成的,获得当前值,加1,写回新值。假设当前i的值为9,如果两个线程都同时读取i值,读到的都是9,然后同时加1,那么这时i的值变为10,但其实是需要加两次,值是1...

Solr整合Tomcat及IKAnalyzer 3.2.8中文分词

一、solr 的简介 Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资...

solr 7.0 tomcat 安装配置 + 中文分词

title: solr 7.0 tomcat 安装配置 + 中文分词author: Eric liutags: [solr,引擎,搜索] categories: solr 搜索 项目背景:Solr...

solr 4.6 tomcat 7.0 IK Analyzer 2012FF_hf1中文分词

1:下载solr4.6,按照tomcat7.0,配置solr的solr_home; 2:导入IKAnalyzer2012FF_u1.jar入solr中的lib;WEB-INF\classes中复制IK...

Lucence的solr的安装和Tomcat的整合(带中文分词)

Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操...

solr cloud 在集群中的配置,以及与中文分词, tomcat等等的整合(1)

因为项目规模的增大,之前所用的solr replication已经无法满足。之前用的solr replication是master/slave结构,即master用来写入,slave用来读取。slav...

solr4.5单机版+中文分词的部署

  • 2017年12月03日 08:25
  • 39KB
  • 下载

solr5 IK-Analyzer中文分词

  • 2016年01月13日 15:57
  • 1.11MB
  • 下载

solr6使用ansj做中文分词

solr中有自带的中文分词,不过它将中文按一个一个字进行分词,这就导致搜索出的结果让人不满 这里以text_general字段为例,managed-schema中的配置是这样写的: ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:2、solr与tomcat及中文分词的整合
举报原因:
原因补充:

(最多只允许输入30个字)