Solr系列
Apache Solr 是一个开源的搜索服务器,使用 Java 语言开发,基于 HTTP 和 Lucene 实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供基于Web的管理界面等
漫天雪_昆仑巅
程序人生
展开
-
Solr安装配置
1 概述Apache Solr是一个功能强大的搜索服务器,它支持REST风格API。Solr是基于Lucene的,Lucene 支持强大的匹配能力,如短语,通配符,连接,分组和更多不同的数据类型。它使用 Apache Zookeeper特别针对高流量进行优化。Apache Solr支持不同格式,包括各种数据库,PDF文件,XML文件,CSV文件等等。 Apache Solr提供各式各样的功能,我原创 2017-06-14 14:07:12 · 16511 阅读 · 3 评论 -
Solr配置文件详解
1 概述Solr配置文件位于solr/conf目录下,因各个版本的solr目录不太一致,所以下面以solr5.x或者以上版本来说明相关配置文件的参数及一些相关作用。 2 目录结构说明 官网下载solr之后解压:目录说明:bin:Solr控制台管理工具存在该目录下。如:solr.cmd等。contrib:该文件包含大量关于Solr的扩展。分别如下:原创 2017-06-14 14:20:01 · 32718 阅读 · 2 评论 -
solr Java测试
1 概述Solr 是一个独立的企业级搜索应用服务器,它对外提供类似于 Web-service 的 API 接口。用户可以通过 http请求,向搜索引擎服务器提交一定格式的 XML 文件,生成索引;也可以通过 Http Get 操作提出查找请求,并得到XML 格式的返回结果。这里主要讲解下通过 http Get 请求这种方式。首先,我们就必须通过 HTTP 请求类似http://local原创 2017-06-14 14:28:55 · 14283 阅读 · 0 评论 -
solr版本升级说明
1 概述Solr5发布了,带来了许多新特性,但Solrj的许多接口也发生了变化,下面是和之前的版本进行的一些对比:变化1:SolrServer变成了SolrClient应该说这个变化是合理的,毕竟Solrj就是一个客户端,命名为Server本身就有问题。这样一来,所有SolrServer系列的类都需要更改为SolrClient系列的类,好在方法基本继承过来了,只需要修改一下类名就可以原创 2017-06-14 14:35:46 · 17958 阅读 · 0 评论 -
solr导入MySql数据
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr原创 2017-06-14 14:44:58 · 21658 阅读 · 2 评论 -
solr导入csv文件
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr 提供 通原创 2017-06-14 14:50:23 · 17944 阅读 · 0 评论 -
solr导入xml文件
1 概述大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。 能够读取关系数据库中的数据。 通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档 能够通过solr文档更新solr原创 2017-06-14 14:55:55 · 16052 阅读 · 0 评论 -
solr分页查询
分页查询:package com.solorj.solrj_test;import java.io.IOException;import org.apache.solr.client.solrj.SolrQuery;import org.apache.solr.client.solrj.SolrServerException;import org.apache.solr.c原创 2017-06-14 14:59:26 · 18605 阅读 · 0 评论 -
Solr搜索引擎原理
本文转载至:http://www.importnew.com/12707.html场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一转载 2017-06-14 15:03:22 · 15500 阅读 · 0 评论 -
Solr分词mmseg4j配置
1 概述中文分词器有多中,常用的有 IKAnalyzer、 mmseg4j。引用:前者最新版本更新到2012年,所以使用的时候要注意可能版本上有不兼容的情况,由于它是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分原创 2017-06-19 10:42:19 · 15527 阅读 · 3 评论 -
Solr or Lucene全文检索实现原理
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML/Json格式的返回结果。采用Java5开发,基于Lucene。 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文转载 2017-06-19 11:19:41 · 18523 阅读 · 2 评论 -
Solr定时增量更新
1 概述将数据库中的数据导入到了solr中之后,如果数据库中的数据有变动,solr中还是第一次导入的旧的数据,因此需要定时检测数据库中的数据变化,并实时将变化的数据同步到solr中。 2 配置定时同步2.1 下载下载地址:http://download.csdn.net/detail/vtopqx/9891724 将下载的solr-dataimport-原创 2017-07-10 11:09:19 · 43738 阅读 · 3 评论 -
Solr主从配置
1 概述Solr是这样一个思路。首先至少有两个solr服务器,一个称为master(主服务),其余的一个或多个solr服务器被称为slave(附属服务)。每个slave轮询检查master的索引库版本,如果发现索引库版本有更新就会拉取master上的索引库:关于solr的集群主要分为主从和SolrCloud两种主从,比较适合以读为主的场景。SolrCloud适合数据量大,时不原创 2017-07-10 13:45:10 · 38856 阅读 · 0 评论 -
Solr查询与sql对比转化
将常用sql查询转化为Solr查询,网上已有做出对比的,这里引用一下,去掉部分图片,快速对比,原文出处:http://shiyanjun.cn/archives/78.html查询对比:---------------------------------------------------------------------------------------------------原创 2017-07-25 21:20:22 · 39825 阅读 · 0 评论 -
Solr聚合查询
1 分组查询1.1 Facet分组solr种以导航为目的的查询结果成为facet,在用户查询的结果上根据分类增加了count信息,然后用户根据count信息做进一步搜索, Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计。 Solr Fact提供了4种类型的Fact原创 2017-07-25 21:33:06 · 33180 阅读 · 1 评论 -
Solr查询参数说明
原文转至:http://blog.csdn.net/yuwenruli/article/details/8448575Solr查询参数说明:http://localhost:8983/solr/solr_select/query?q=*:*&fl=id参数说明如下:q – 查询字符串,必须的。Solr 中用来搜索的查询。有关该语法的完整描述,请参阅 参考资料 中原创 2017-07-25 21:40:02 · 41540 阅读 · 0 评论 -
Solr与Tomcat配置
1 概述Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言原创 2017-07-26 20:48:34 · 31505 阅读 · 1 评论 -
Solr集群配置
1 概述Solr是以Lucene为基础实现的文本检索应用服务。而Lucene是一个Java语言编写的利用倒排原理实现的文本检索类库。SolrCloud是基于Solr和Zookeeper的分布式搜索方案。当索引越来越大,一个单一的系统无法满足磁盘需求,查询速度缓慢,此时就需要分布式索引。在分布式索引中,原来的大索引,将会分成多个小索引,solr可以将这些小索引返回的结果合并,然后返回给原创 2017-07-28 14:38:00 · 42306 阅读 · 1 评论