中文分词器安装

最新推荐文章于 2022-04-08 00:53:13 发布

zhouzhou_98

最新推荐文章于 2022-04-08 00:53:13 发布

阅读量155

点赞数

分类专栏： Solr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouzhou_98/article/details/100984539

版权

Solr 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1.solr是一个全文检索引擎系统,通过部署到tomcat下就可以独立运行,通过http协议对外提供全文检索服务,

就是索引和文档的正删改查服务

2. solr直接操作索引库和文档库, 我们的业务系统中可以使用solrJ(solr的客户端,就是一堆jar包)来调用solr服务端,

让solr服务端操作文档库和索引库,完成正删改查的任务,将结果返回给solrJ客户端,我们在业务系统中就可以,

获取到结果然后返回给客户在浏览器中显示.

3. solrHome:solrhome就是solr最核心的目录, 一个solrhome中可以有多个solr实例

4. solrCore:一个solrCore就是一个solr实例,solr中实例与实例之间他们的索引库和文档库是相互隔离的

每个实例对外单独的提供索引和文档的增删改查服务,默认实例叫做collection1

5. 文档和索引的增加和修改必须要有id, 主键域,没有会报错

6. 域名和类型必须先定义后使用,如果没有定义就使用会报错

7. 域的分类

普通域:string long 等

动态域:起到模糊匹配的效果,可以模糊匹配没有定义过的域名

例如:xxxx这个域名没有定义,但是xxxx_s这个域名模糊匹配了*_s这个域,所以相当于xxxx_s这个域定义了

主键域:<uniqueKey>id</uniqueKey> 一般主键域就用默认的这个就可以不需要更改或者添加

复制域: 复制域用于查询的时候从多个域中进行查询,这样可以将多个域复制到某一个统一的域中,

然后搜索的时候从这个统一的域中进行查询,就相当于从多个域中查询了.

8.是否存储和是否索引无关, 索引后就能查询,不索引就不能根据这个域搜索,

存储后就能取出来里面的内容,不存储就取不出这个域内容

9. 一般企业中将数据全部放入数据库中, 由于查询的时候需要使用like模糊查询,模糊查询数据库中使用的是全表扫描算法,

这样效率低级,所以需要使用全文检索,来优化查询速度.

首先来到solr的WEB-INF的lib目录下，

当前本人的目录是：D:\apache-tomcat-9.0.6\webapps\solr\WEB-INF\lib

在lib包下加入：

接着在solr的WEB-INF的目录下创建classes

接着将以下三个文件放入classes目录下

接下来配置schema.xml文件夹

在schema.xml中添加一个自定义的fieldType，使用中文分析器。

<fieldType name="text_ik" class="solr.TextField">

<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

定义field，指定field的type属性为text_ik

<field name="title_ik" type="text_ik" indexed="true" stored="true" />

<field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

重启Tomcat

分词效果：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
中文分词器安装

1.solr是一个全文检索引擎系统,通过部署到tomcat下就可以独立运行,通过http协议对外提供全文检索服务, 就是索引和文档的正删改查服务2. solr直接操作索引库和文档库, 我们的业务系统中可以使用solrJ(solr的客户端,就是一堆jar包)来调用solr服务端, 让solr服务端操作文档库和索引库,完成正删改查的任务,将结果返回给solrJ客户端,我们在...
复制链接

扫一扫

专栏目录

zhouzhou_98 CSDN认证博客专家 CSDN认证企业博客

码龄6年

215: 原创

6万+: 周排名

191万+: 总排名

21万+: 访问

: 等级

3993: 积分

32: 粉丝

26: 获赞

13: 评论

133: 收藏

私信

关注

热门文章

分类专栏

SpringBoot 18篇
zookeeper 7篇
ArrayList 1篇
jvm 11篇
设计模式 1篇
juc 5篇
LeetCode 12篇
Mybatis Plus 3篇
zxing 1篇
poi 1篇
layui 21篇
Solr 7篇
Redis 10篇
Lucene 17篇
SpringMVC定时器 1篇
Java爬虫 2篇

最新评论

wangeditor批量上传图片
一匹奔跑的骏马: files 怎么做到的
使用JavaAgent测试Object的大小(以64位的计算机为例)
木¥木: 你这个改都不改，截图和资料就发现成的
回文链表
强哥带你飞: 中点的下个节点传给反转链表有问题，比如是偶数8节点的，你传的的反转链表的节点就是第6个节点，只比较了6、7、8个节点，第5个就给漏了啊，力扣这个回文列表测试用例也有问题
layui的基本使用
美酒没故事°: https://v5.bootcss.com/docs/getting-started/introduction/ 也不错
构造器注入
Deep Learning小舟: 受教了，给博主递茶

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。