Solr4.4入门,介绍Solr的安装、IK分词器的配置及高亮查询结果(一)

转载 2016年06月02日 09:50:51

一、Windows下安装solr-4.4.0

1、  下载solr.4.4

2、  下载绿色版tomcat6.0.18

3、  解压下载的solrd:\study\solr,将dist目录下的solr4.4.0.war包复制到tomcatwebapps

4、  web.xml中配置solr.home为解压的 solr中的d:\study\solr\example\solr

<env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>D:\study\solr\solr-4.4.0\example\solr</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

</env-entry>

如果不做此配置,在启动的时候将会报异常 

solr - org.apache.solr.common.SolrException: Could not load config for solrconfig.xml

5、  启动tomcat,访问http://localhost:8080/solr-4.4.0即可访问

6、  在左侧树中,选择collection1,会弹出节点菜单,其中documents功能表示往索引目录中添加记录,而Query可以查询指定目录。

7、  往服务中添加索引

String url = "http://localhost:8080/solr-4.4.0";

       SolrServer server = new HttpSolrServer(url);

       SolrInputDocument doc1 = new SolrInputDocument();

       doc1.addField("id""1");

       doc1.addField("title""信息科技");

    doc1.addField("content""企业信息门户,元数据,数字沙盘,知识管理");

server.add(docs);

    server.commit();

8、  查询

public static void main(String[] args) {

        String url = "http://localhost:8080/solr-4.4.0";

        SolrServer server = new HttpSolrServer(url);

        SolrQuery query = new SolrQuery("云南");

        query.setFacetLimit(1);

        //以下两个参数常用作分页时使用

        query.setRows(1);// 设置每次取多少条

        query.setStart(0);//设置从第几条开始查询

//以下几行设置查询结果关键字高亮显示

        query.setHighlight(true);

        // hl.fl参数表示哪个几Field关键字段高亮

        query.setParam("hl.fl""title, content");

query.setHighlightSimplePre("<font color=red>"); query.setHighlightSimplePost("</font");                                    query.setSort("name",ORDER.desc);

        try {

            QueryResponse response = server.query(query);

            SolrDocumentList docs = response.getResults();

            System.out.println("文档个数:" + docs.getNumFound());

            System.out.println("查询时间:" + response.getQTime());

            for (SolrDocument doc : docs) {

               System.out.println("title: " + doc.getFieldValue("title"));

                System.out.println("content : " + doc.getFieldValue("content "));

             }

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

 二、在solr中配置IK中文分词器

在目录solr/example/solr/collection1/conf中的 secham.xmltypes标签最后添加定义字段类型。

secham.xml文件是定义的类型以及存储的域。

<fieldType name="text_ik" class="solr.TextField"> 

<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> 

         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> 

</fieldType>

field中指定字段类型为上面定义的

<field name="name" type="text_ik" indexed="true" stored="true"/>

设置完比后重启服务

admin管理台中,由于nameIK分词器,所以分词后的效果如下:

Solr4.4入门,介绍Solr的安装、IK分词器的配置及高亮查询结果(一) - hbin8668 - HBIN8668IYUEE
 
 

title域是用的默认的分词器,即text_general,分词效果如下:

Solr4.4入门,介绍Solr的安装、IK分词器的配置及高亮查询结果(一) - hbin8668 - HBIN8668IYUEE
这说明IK分词器配置成功
( 网易博客有点扯蛋呀。字符多点一直报错。说无法保存,请稍后再试)

如何设置SOLR的高亮 (highlight)?

打开SOLR的核心配置文件: solrconfig.xml   找到 standard request handler   写入以下XML配置代码:   ...
  • shubingzhuoxue
  • shubingzhuoxue
  • 2016年01月04日 15:37
  • 5273

solr4.7中文分词器(ik-analyzer)配置

solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。 solr版本:4.7.0 需要ik-a...
  • clj198606061111
  • clj198606061111
  • 2014年03月15日 17:00
  • 34882

solr配置IK分词器并设置粗细粒度

solr配置IK分词器并设置粗细粒度solr加入索引时使用分词器,搜索时也使用该分词器,导致搜索时返回数据不准确如: 搜索清华大学 经ik分词显示结果为 清华/大...
  • x631617479
  • x631617479
  • 2017年04月06日 15:17
  • 1519

solr安装及IK分词器配置详述

solr安装及IK分词器配置详述
  • makang110
  • makang110
  • 2016年03月16日 16:40
  • 580

Solr配置IK分词器自定义词库

https://my.oschina.net/crxy/blog/412202
  • Bleachswh
  • Bleachswh
  • 2016年12月12日 16:08
  • 1039

solr6.0配置中文分词器IK Analyzer

solr6.0中进行中文分词器IK Analyzer的配置和solr低版本中最大不同点在于IK Analyzer中jar包的引用。一般的IK分词jar包都是不能用的,因为IK分词中传统的jar不支持s...
  • linzhiqiang0316
  • linzhiqiang0316
  • 2016年06月01日 10:57
  • 17431

Solr配置中文分词器IK Analyzer详解

配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4...
  • tjcyjd
  • tjcyjd
  • 2015年02月03日 18:34
  • 28838

三、Solr多核心及分词器(IK)配置

多核心的概念 多核心说白了就是多索引库。也可以理解为多个"数据库表" 说一下使用multicore的真实场景,比若说,产品搜索和会员信息搜索,不使用多核也没问题,这样带来的问题是 indexs文件...
  • jingqiang521
  • jingqiang521
  • 2015年07月21日 13:37
  • 716

IK分词源码讲解(五)-ik配置及在Solr中的配置使用

在solr中配置使用IK很简单 下载最新的Ik2012中文分词器。  2.解压IK Analyzer 2012FF_hf1.zip,获得IK Analyzer 2012FF_hf1. 将该目录下的IK...
  • a925907195
  • a925907195
  • 2014年12月09日 17:27
  • 4623

solr5.3.1 集成IK中文分词器

参考文章:http://www.cnblogs.com/sword-successful/p/5604541.html 转载文章:http://www.cnblogs.com/pazsolr/p/5...
  • paulluo0739
  • paulluo0739
  • 2016年09月09日 19:17
  • 1590
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Solr4.4入门,介绍Solr的安装、IK分词器的配置及高亮查询结果(一)
举报原因:
原因补充:

(最多只允许输入30个字)