Solr全文检索技术
文章平均质量分 65
潜力股wjk
很多东西今生只可给你
展开
-
Solr实战之(一)Solr入门
(1)当今,软件架构所面临的一个主要挑战是处理广泛的全球群体消费和产生的大数据;为解决现代web应用的可扩展性和可用性需求,NoSQL技术受到越来越多的关注,Apache下的Solr便是一种NoSQL技术。 (2)Solr是可扩展的,开箱即用的企业级搜索引擎,用来搜索大规模文本数据并根据相关度排序结果。 (3)Solr构建在Apache的Lucene上,Lucene是基于Java的开源信息检索原创 2018-01-17 15:29:18 · 938 阅读 · 0 评论 -
Linux上安装部署Solr-4.10.4并测试
Solr是一种全文检索技术,在一些门户社区中能提高用户体验。Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。 接下来,将介绍如何在Linux系统(Ubuntu)上安装部署solr服务(solr4.10.原创 2018-01-16 10:06:08 · 1835 阅读 · 1 评论 -
Solr实战之(二)Solr基础理论
2.1 什么是文档? Solr是一个文档存储与检索引擎,提交给Solr处理的每一份数据都是一个文档(一片新闻报道,一份简历,社交用户信息);每个文档包含一个或多个字段,每个字段被赋予具体的字段类型。Solr查询返回的主要搜索结果是由一个或多个字段组成的文档集。2.2 基本搜索问题 背景:传统SQL数据库实现查询时,如果要求所有词都匹配到,会导致一些相关的图书未被找到;如果要求一个词匹配原创 2018-01-18 14:30:05 · 445 阅读 · 0 评论 -
Solr实战之(三)配置Solr
3.1. 请求分配器(从技术角度看,统一请求分配器就是一个Java servlet过滤器,可以为Solr Web应用过滤出符合/*的URL)的主要职能是根据用户请求语句定位到处理该请求的内核,如collection1,然后将用户请求交给该内核中已注册的对应请求处理器(requestHandler),如/select;/select请求处理器利用一系列搜索组件处理客户端请求;查询结果经由响应读原创 2018-01-26 10:52:59 · 263 阅读 · 0 评论 -
使用SolrJ管理索引库
前面博文说到,Solr是基于Lucene的搜索引擎,那么如何使用引擎呢?或者说如何通过引擎的API接口来操作Solr服务呢?这就是接下来要研究的使用SolrJ来操作管理索引库。接下来我们来使用SolrJ进行Solr的增删查改和查询结果高亮显示。SolrJ是访问Solr服务的Java客户端,提供索引和搜索的请求方法,Solr通常嵌入在业务系统中,通过SolrJ的API接口操作Solr服务。1...原创 2018-03-12 10:28:47 · 243 阅读 · 0 评论 -
Solr设置IK分词器
话不多说,首先当然准备资料啦: IKAnalyzer2012_FF.jar IKAnalyzer.cfg.xml (IK扩展分词和扩展停止词的设置) mydict.dic(扩展分词词典) stopword.dic(扩展停止词词典)说明:第一个是jar...原创 2018-03-14 16:19:28 · 883 阅读 · 0 评论 -
Solr分词后,如何实现多个关键字完全匹配
如题,Solr查询中要进行多个关键字的完全匹配。 在Schema.xml的字段配置中,设置了type=”test_ik”为IK分词器,每次的匹配都是在分词后的结果上进行匹配的,这就导致了要搜索的字段中如果有包含分词后的词语,就都会被匹配出来,如下所示(这里用高亮来看匹配的结果) 可以看到,”原告向被告借款“被分词了,含有”原告”,”被告”的关键因子也被匹配出来如下,不能实现完全匹配,只实现...原创 2018-06-05 18:05:35 · 10999 阅读 · 0 评论