Solr
Clement-Xu
经验总结。
展开
-
Solr 搜索的过程和所需要的参数
一个典型的搜索处理过程,以及所需要的参数如下:qt:指定一个RequestHandler,即/select,缺省是使用DisMax RequestHandlerdefType:选择一个query parser,缺省是RequestHandler中配置的那个qf:指定需要搜索的field,如果不指定就搜索所有的fieldstart, rows:指明分页参数fq:指明需要如何过滤搜索结果,原创 2015-08-24 11:32:36 · 2880 阅读 · 0 评论 -
Solr 关于Analyzer、Tokenizer、和Filter,以及中文分词器
对于文本数据(solr.TextField),solr在建立索引和搜索的时候需要拆分它们、并做一些相应的处理(比如英文要去掉介词、转成小写、单词原形化等,中文要恰当地要分词)。这些工作,一般由Analyzers、Tokenizers、和Filter来实现。这三个东东配置在fieldType中。ananlyzer:告诉solr在建立索引和搜索的时候,如何处理text类型的内容,比原创 2015-08-19 20:22:02 · 7163 阅读 · 0 评论 -
Solr DataImportHandler 配置
DIH主要用于从数据库抓取数据并创建索引。另外还可以从HTTP(RSS、ATOM)拉数据。相关概念:Datasource:数据源,包括获取数据必需的信息:数据位置(url)、数据库driver、登录账号和密码Entity:相当于数据库的一个视图,可以从一个表或联表查询获得Processor:数据处理器,负责从数据源中获取数据、处理、然后加入到索引中Transformer:数原创 2015-08-20 20:57:58 · 3586 阅读 · 0 评论 -
Solr 配置文件之schema.xml
schema.xml这个配置文件的根本目的是为了通过配置告诉Solr如何建立索引。solr的数据结构如下:document:一个文档、一条记录field:域、属性solr通过搜索某个或某些field,返回若干个符合条件的document,或者按搜索的score排序返回。如果跟数据库对比,document相当于数据库的表,field相当于表中的字段原创 2015-08-14 18:55:53 · 8050 阅读 · 0 评论 -
Zookeeper 及其安装配置和启动
Zookeeper 为分布式系统提供一次性的服务,管理和协调分布式系统的工作,保证系统的高有效性。为什么需要它?因为分布式系统很容易出错,特别是在处理竞争和死锁的过程中。提供的功能包括:配置维护、名字服务、分布式同步、组服务等。Client就是分布式系统中的节点,他们可以在ZooKeeper中设置监控,如果ZooKeeper中的目录节点存储的数据修改了,就会通知原创 2015-08-28 19:57:46 · 18228 阅读 · 0 评论 -
Solr SolrCloud相关概念
Solr支持服务器的分布式集群部署,即SolrCloud。在SolrCloud中,一个索引可以被分布到不同的服务器,即不同的node,所有的这些node组成一个collection,并且充分考虑了高可靠性和容错的设计。SolrCloud使用zookeeper来管理这些服务器,被搜索的文件可以放在任何一个服务器,ZooKeeper会自动管理它们。一个collection可以把原创 2015-08-28 15:10:12 · 3031 阅读 · 1 评论 -
Solr(5.2.1)安装、启动和建立索引
总结solr的下载、安装、启动和建立索引的过程。原创 2015-08-12 19:58:38 · 4176 阅读 · 0 评论 -
Solr基本概念
Solr是一种开放源码的、基于Lucene的搜索服务器。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。官网:http://lucene.apache.org/solr/Solr全文检索基本原理:http://www.importnew.com/12707.html原创 2015-08-12 19:49:35 · 4142 阅读 · 1 评论 -
Solr 在Linux系统中的产品化安装
不同于测试和研究,如果要把Solr产品化部署的话,需要把它安装成一个服务。在Solr压缩包中的bin目录下有一个脚本install_solr_service.sh,它负责solr的安装、并且注册为自启动的service。目录规划:动态文件:建议把动态文件(log、索引文件)单独放到另外的目录中(比如/var 里面),跟Solr安装目录不同,以方便管理和以后的升级。缺省是/var/s原创 2015-08-27 15:06:43 · 1674 阅读 · 0 评论 -
Solr 配置文件之core.properties、solr.xml和Config Sets
从5.0开始,solr采用了自动发现模式(discovery,区别于传统模式legacy),Solr会自动找到安装目录中、或solr_home中的配置文件:core.properties,并根据里面的name属性来初始化相对于的core。solr.xml中仍然会定义一些配置参数,但是core本身不会定义在这个文件中。Solr会递归搜索所有solr和solr_home目录和子目录,当原创 2015-08-26 15:40:42 · 5390 阅读 · 0 评论 -
Solr 配置文件之solrconfig.xml
顾名思义,solrconfig.xml主要是配置跟自身相关的参数,比如:为建索引和搜索等请求配置Request Handler为某些事件配置listener,以触发执行某些代码为HTTP请求配置Request Dispatcher配置Admin Web为分布式的复制配置相关的参数这个配置文件位于每个collection的conf/中,在server/solr/c原创 2015-08-25 12:04:44 · 7260 阅读 · 0 评论 -
Solr 启动一个SolrCloud实例所需要的所有配置和相关参数
SolrCloud使用ZooKeeper来管理配置文件,所以需要安装、配置、并启动ZooKeeper。主要步骤:安装和启动Solr(Service方式)配置和启动ZooKeeper配置和启动一个collection:为新的collection创建配置文件目录、准备好配置文件把配置文件上传到ZooKeeper创建新的collection(使用Collections A原创 2015-09-01 19:51:27 · 4019 阅读 · 0 评论