Linux--solr配置中文分析器

    中文分析器的原理是:用户给solr很多信息,经过查询找到你想要的信息。输入所有信息的部分称为索引更新在Solr中,文档由字段组成可以通过指定字段类型来告诉Solr字段包含的数据类型字段类型告诉Solr如何解释字段以及如何查询字段。字段可以包含不同种类的数据。Solr将获取文档字段中的信息并将该信息添加到索引。当用户执行查询时,Solr可以快速查阅索引并返回匹配的文档。字段分析告诉Solr构建索引时如何处理传入数据。这个过程的更准确的名称将被处理,甚至消化,但官方名称是分析

创建一个核心

    如果没有使用示例配置启动Solr,则需要创建一个核心才能进行索引和搜索。通过运行:

bin/solr create -c <自定义实例名称>


    这将创建一个使用数据驱动架构的核心,当将文档添加到索引时,该架构会尝试猜测正确的字段类型。

    要查看创建新内核的所有可用选项,请执行:

bin/solr create -help

Solr的配置文件


  • solr.xml为您的Solr服务器实例指定配置选项

  • 每个Solr核心:

    • core.properties为每个核心定义特定的属性,例如其名称,核心所属的集合,模式的位置以及其他参数

    • solrconfig.xml控制高层行为。例如,您可以为数据目录指定一个备用位置。

    • managed-schema(或者schema.xml改为)描述您将要求Solr编制索引的文档。Schema将文档定义为字段集合。您可以定义字段类型和字段本身。字段类型定义功能强大,包含有关Solr如何处理传入字段值和查询值的信息。

    • data/ 包含低级索引文件的目录。

Solr添加字段

浏览器添加

    在Core Selector选择Order





orderName已经添加成功

另外有一种方法,从配置文件conf/managed-schema中添加字段从而实现中文分析器的目的。


配置业务域

schema.xml中定义:

    1、商品Id

    2、商品标题

    3、商品卖点

    4、商品价格

    5、商品图片

    6、分类名称

创建对应的业务域。需要制定中文分析器。


创建步骤:

第一步:拷贝jar包

cp /usr/local/solr/solr-7.2.1/dist/solr-dataimporthandler-7.2.1.jar  /usr/local/solr/tomcat8/webapps/solr/WEB-INF/lib/ 
cp /usr/local/solr/solr-7.2.1/contrib/analysis-extras/lucene-libs/*  /usr/local/solr/tomcat8/webapps/solr/WEB-INF/lib/ 

第二步:配置一个FieldType,制定使用中文分析器。

    修改/usr/local/solr-7.2.1/server/solr/core1/conf路径下的schema.xml文件

    修改Solr的schema.xml文件,添加FieldType:

<!-- ChineseAnalyzer -->  
    <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100">  
      <analyzer type="index">  
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>  
      </analyzer>  
      <analyzer type="query">  
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>  
      </analyzer>  
    </fieldType>


第三步:配置业务域,type制定使用自定义的FieldType。

    设置业务系统Field

<field name="item_title" type="text_ik" indexed="true" stored="true"/>

<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>

<field name="item_price"  type="long" indexed="true" stored="true"/>

<field name="item_image" type="string" indexed="false" stored="true" />

<field name="item_category_name" type="string" indexed="true" stored="true" />

 

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

<copyField source="item_title" dest="item_keywords"/>

<copyField source="item_sell_point" dest="item_keywords"/>

<copyField source="item_category_name" dest="item_keywords"/>

第四步:重启solr服务

介绍完毕!



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 18
    评论
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨倩-Yvonne

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值