搜索为将 -- Solr 6.6 从入门到进阶(一)

前言

1、私信请在SegmentFault 传送点 https://segmentfault.com/a/1190000010959342,有问必答
2、转发请注明出处 http://3dot141.cn/blogs/29869.html,也给小可爱一点出名的机会嘛

一、版本介绍

tomcat 9
JDK 1.8
solr 6.6

二、流程介绍

  1. 官网下载 solr 6.6 然后解压到文件夹。

  1. 将 server/server-webapp 下的 webapp 复制到 tomcat 的 webapp 包下


并改名为 solr 

  1.  打开 在 tomcat 下的 solr 项目, solr ( webapp 改名后的solr )/WEB-INF/web.xml 文件,在开头找到类似代码,取消注释并修改,如下

    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/Programme/0-Java/J_workspace/solr_home</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

注:此处是我的 solrhome 的文件位置 , 你可以自行设置

  1. 将 server/lib 下的 metrics-.jar 包 与 dist 下的 solr-dataimporthandler- .jar 包 复制到你在tomcat / webapp 下的 solr /WEB-INF/ lib 目录中。

  2. 将 server/resources 目录下的 log4j.properties 文件 拷贝到 tomcat/webapp/solr/WEB-INF/classes 目录下,没有,就自己新建一个。

  3. 自己根据上文 web.xml 中配置的 solr/home 信息,建立 solr_home 文件夹 。并将 server / solr  下的文件全部 拷贝到 solr_home 文件夹下。

  1. 在 solr_home 目录下建立一个 文件夹,new_core 作为 你 的solr_core。并将 上图中 configsets / sample_techproducts_configs 目录下的 conf 文件夹 拷贝到 new_core 文件夹下。


  1. 配置 lib 标签。
    将 solr 6.6 压缩包内的 contrib 与 dist 文件夹 复制到 solr_home 文件夹下。


打开 new_core/conf/solrconfig.xml 文件,从中找到如下代码形式。

<lib dir="${solr.install.dir:

将之更改为如下形式

  <lib dir="${solr.install.dir:..}/contrib/extraction/lib" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-cell-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/clustering/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-clustering-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/langid/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-langid-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/ltr/lib/" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-ltr-\d.*\.jar" />

  <lib dir="${solr.install.dir:..}/contrib/velocity/lib" regex=".*\.jar" />
  <lib dir="${solr.install.dir:..}/dist/" regex="solr-velocity-\d.*\.jar" />

解释一下,这里的根目录是 你自身的 solr_core 目录。对我来说 ,就是 new_core 所在的目录。

所以 


../  == solr_home 目录
  1. 成果展示

打开http://localhost:8080/solr/index.html 会出现如下画面

三、可能出现的异常

根据这位博主的文章http://www.jianshu.com/p/dd7a...

总结如下:

1.启动tomcat时如果报下面的错误:

严重: Exception starting filter SolrRequestFilter
java.lang.NoClassDefFoundError: com/codahale/metrics/MetricSetat java.lang.Class.getDeclaredConstructors0(Native Method)
at java.lang.Class.privateGetDeclaredConstructors(Class.java:2671)
at java.lang.Class.getConstructor0(Class.java:3075)at java.lang.Class.newInstance(Class.java:412)
at org.apache.catalina.core.DefaultInstanceManager.newInstance(DefaultInstanceManager.java:119)
at org.apache.catalina.core.ApplicationFilterConfig.getFilter(ApplicationFilterConfig.java:258)
at org.apache.catalina.core.ApplicationFilterConfig.<init>(ApplicationFilterConfig.java:105)
at org.apache.catalina.core.StandardContext.filterStart(StandardContext.java:4700)
at org.apache.catalina.core.StandardContext.startInternal(StandardContext.java:5340)
at org.apache.catalina.util.LifecycleBase.start(LifecycleBase.java:145)
at org.apache.catalina.core.ContainerBase.addChildInternal(ContainerBase.java:753)
at org.apache.catalina.core.ContainerBase.addChild(ContainerBase.java:729)
at org.apache.catalina.core.StandardHost.addChild(StandardHost.java:717)
at org.apache.catalina.startup.HostConfig.deployDirectory(HostConfig.java:1092)
at org.apache.catalina.startup.HostConfig$DeployDirectory.run(HostConfig.java:1834)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)Caused by: java.lang.ClassNotFoundException:com.codahale.metrics.MetricSet
at org.apache.catalina.loader.WebappClassLoaderBase.loadClass(WebappClassLoaderBase.java:1333)
at org.apache.catalina.loader.WebappClassLoaderBase.loadClass(WebappClassLoaderBase.java:1167)
... 20 more

请把solr-6.4.1/server/lib下的metrics-core-3.1.2.jar,metrics-ganglia-3.1.2.jar,metrics-graphite-3.1.2.jar,metrics-jetty9-3.1.2.jar,metrics-jvm-3.1.2.jar这几个jar包放到tomcat下的solr项目的WEB-INF/lib目录下。

2.访问http://localhost:8080/solr/index.html时如果报下面的错误:

HTTP Status 403 - Access to the requested resource has been denied

把tomcat下的solr项目的web.xml文件中

<security-constraint>
  <web-resource-collection>
    <web-resource-name>Disable TRACE</web-resource-name>
    <url-pattern>/</url-pattern>
    <http-method>TRACE</http-method>
  </web-resource-collection>
  <auth-constraint/>
</security-constraint>
<security-constraint>
  <web-resource-collection>
    <web-resource-name>Enable everything but TRACE</web-resource-name>
    <url-pattern>/</url-pattern>
    <http-method-omission>TRACE</http-method-omission>
  </web-resource-collection>
</security-constraint>

这段注释掉。这段配置限制了对solr资源的访问,注释掉就可以访问了。

3.java.lang.NoSuchMethodError:

解决:solr5.5以上版本在tomcat8下运行
由于solr5.5.0和solr5.5.1 版本部署在tomcat7下的时候,会报Java.lang.NoSuchMethodError: javax.servlet.ServletInputStream.isFinished()Z的错误,这个是serverlet3.1才有的方法。

4.javax.servlet.ServletInputStream.isFinished

解决:solr5版本以上的部署最好使用JDK1.8
solr5版本以上的部署最好使用JDK1.8,虽然官网没有明确表示solr5必须是要使用JDK1.8,但是其中一部分功能锁需求的JDK版本在JDK1.7以下是没有的
比如:Java.lang.NoSuchMethodError: javax.servlet.ServletInputStream.isFinished()Z
我是在全量索引的时候发生的此异常提示:找不到ServletInputStream类下面的isFinished()方法,那么现在我们找到该类ServletInputStream
如果在这个类下面没有isFinished()方法,那就是JAR包问题,这个类所在的jar包是servlet-api.jar

5.待解决:

web.xml 文件中 的 <welcome-file-list> 标签失效的原因 。

正常部署后,直接访问 localhost:8080/solr 应该就可以使用,但是,会出现不能加载 UI 的说明。

只有访问 localhost:8080/solr/index.html 才可以正常加载。

分析web.xml 文件,发现一段 servlet 配置

  <servlet>
    <servlet-name>LoadAdminUI</servlet-name>
    <servlet-class>org.apache.solr.servlet.LoadAdminUiServlet</servlet-class>
  </servlet>    
  <servlet-mapping>
    <servlet-name>LoadAdminUI</servlet-name>
    <url-pattern>/index.html</url-pattern>
  </servlet-mapping>

但是,自己太菜,分析不出原因。所以还需要,之后的学习中多注意。

四、与中文分词器的适配

1.smart-cn

从 solr-6.6.0/contrib/analysis-extras/lucene-libs 下拷贝 lucene-analyzers-smartcn-6.6.0 到 apache-tomcat-9.0.0.M20/webapps/solr/WEB-INF/lib 目录下。

  1. 打开 solrhomenew_coreconf 下的managed-scheme 文档

  2. 加入以下内容

<fieldType name="text_sm" class="solr.TextField">
    <analyzer class="org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer" /></fieldType>

或者可以使用TokenizerFactory

<fieldType name="text_sm" class="solr.TextField" >
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
       <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

2.IKAnalyzer

这里有最新适配 solr6.6 的 IKAnalyzer,这里是 适配攻略
进入可下载. 下载地址
下载后,将IKAnalyzer.jar 包 拷贝到 apache-tomcat-9.0.0.M20/webapps/solr/WEB-INF/lib 目录下

  1. 打开 solrhomenew_coreconf 下的managed-scheme 文档

  2. 加入以下内容

<fieldType name="text_ik" class="solr.TextField">
        <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

或者可以使用TokenizerFactory

<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
       <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/>
    </analyzer>
</fieldType>
  1. 成果展示

输入图片说明

结语

以上就是对 solr 进行的一些简单操作,下一篇文章将会介绍如何将 solr 与 java 、 mysql 数据库结合起来,使用。

喜欢的话可以点一下收藏,与关注哦~,码字不易。
谢谢~~~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值