中文分词器安装

1.solr是一个全文检索引擎系统,通过部署到tomcat下就可以独立运行,通过http协议对外提供全文检索服务,

     就是索引和文档的正删改查服务

2. solr直接操作索引库和文档库, 我们的业务系统中可以使用solrJ(solr的客户端,就是一堆jar包)来调用solr服务端,

     让solr服务端操作文档库和索引库,完成正删改查的任务,将结果返回给solrJ客户端,我们在业务系统中就可以,

     获取到结果然后返回给客户在浏览器中显示.

 

3. solrHome:solrhome就是solr最核心的目录, 一个solrhome中可以有多个solr实例

4. solrCore:一个solrCore就是一个solr实例,solr中实例与实例之间他们的索引库和文档库是相互隔离的

     每个实例对外单独的提供索引和文档的增删改查服务,默认实例叫做collection1

 

5. 文档和索引的增加和修改必须要有id, 主键域,没有会报错

6. 域名和类型必须先定义后使用,如果没有定义就使用会报错

 

7. 域的分类

     普通域:string long 等

     动态域:起到模糊匹配的效果,可以模糊匹配没有定义过的域名

          例如:xxxx这个域名没有定义,但是xxxx_s这个域名模糊匹配了*_s这个域,所以相当于xxxx_s这个域定义了

     主键域:<uniqueKey>id</uniqueKey> 一般主键域就用默认的这个就可以不需要更改或者添加

     复制域: 复制域用于查询的时候从多个域中进行查询,这样可以将多个域复制到某一个统一的域中,

          然后搜索的时候从这个统一的域中进行查询,就相当于从多个域中查询了.

 

8.是否存储和是否索引无关, 索引后就能查询,不索引就不能根据这个域搜索,

     存储后就能取出来里面的内容,不存储就取不出这个域内容

 

9. 一般企业中将数据全部放入数据库中, 由于查询的时候需要使用like模糊查询,模糊查询数据库中使用的是全表扫描算法,

     这样效率低级,所以需要使用全文检索,来优化查询速度.

 

首先来到solr的WEB-INF的lib目录下,

当前本人的目录是:D:\apache-tomcat-9.0.6\webapps\solr\WEB-INF\lib

在lib包下加入:

 

接着在solr的WEB-INF的目录下创建classes

接着将以下三个文件放入classes目录下

接下来配置schema.xml文件夹

在schema.xml中添加一个自定义的fieldType,使用中文分析器。

<!-- IKAnalyzer-->

    <fieldType name="text_ik" class="solr.TextField">

      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

    </fieldType>

 

定义field,指定field的type属性为text_ik

<!--IKAnalyzer Field-->

   <field name="title_ik" type="text_ik" indexed="true" stored="true" />

   <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

 

 

重启Tomcat

分词效果:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值