Lucene/Solr
lzx1104
这个作者很懒,什么都没留下…
展开
-
Solr Java客户端(SolrJ)
参考:http://wiki.apache.org/solr/Solrjlibjars原创 2014-08-19 10:35:10 · 919 阅读 · 0 评论 -
Solr Searching
一个搜索查询由一个request handler处理,它调用一个query parser来解析查询的词语和参数。默认的query parser是DisMax,Solr也包含Standard (Lucene),和Extended DisMax (eDisMax) query parser.Standard的搜索语法要求更高准确性,但DisMax容错性更好,像Google等流行搜索引擎一样很少翻译 2014-12-20 16:07:08 · 618 阅读 · 0 评论 -
SolrConfig中的ManagedIndexSchemaFactory和add-unknown-fields-to-the-schema
新的SolrConfig配置中使用了一个管理Schema配置,以4.9.0为例:solr-4.9.0/example/example-schemaless/solr/collection1/conf/solrconfig.xml这个示例配置文件中,有一个ManagedIndexSchemaFactory配置项,其含义翻译如下:如果使用了ManagedIndexSchemaFactory,S原创 2014-12-19 17:24:45 · 2052 阅读 · 0 评论 -
Solr与开源中文分词(mmseg4j)
mmseg4j下载https://github.com/ktmud/mmseg4jhttps://github.com/chenlb/mmseg4j-solr下载mmseg4j-solr-2.2.0-with-mmseg4j-core.zip,并解压,里面有两个jar包:mmseg4j-core-1.10.0.jar和mmseg4j-solr-2.2.0.jar使用原创 2015-01-06 14:48:12 · 783 阅读 · 0 评论 -
Solr与开源中文分词(IKAnalyzer)
1. 源码与Jar包下载:http://git.oschina.net/wltea/IK-Analyzer-2012FF2. IKAnalyzer与Solr(Tomcat)整合:1) 将IKAnalyzer2012FF_u1.jar放到${tomcat}/webapps/solr/WEB-INF/lib/目录下2) 配置Solr集合的Schema.xml原创 2015-08-13 16:00:59 · 897 阅读 · 0 评论 -
将Solr5部署到生产环境
== 将Solr部署到生产环境-- Solr服务安装脚本Solr包含一个安装脚本(bin/install_solr_service.sh)能帮助你在linux下安装Solr服务。在运行安装脚本前,你需要决定设置一些参数。尤其是在哪安装Solr和Solr文件及进程属于哪个系统用户。- 安排你的目录结构我们建议将Solr产生的文件,如日志和索引文件,与Solr发布包含的文件原创 2016-04-29 11:14:55 · 897 阅读 · 0 评论 -
Solr-5.5 QuickStart
solr-5.5centos-6.5= 安装solr:[ solr-5.5.0]# tar zxf solr-5.5.0.tgz= 运行solr:[ solr-5.5.0]# bin/solr start #后台运行[ solr-5.5.0]# bin/solr stop= Solr脚本选项:帮助$ bin/solr -help原创 2016-04-26 17:08:32 · 533 阅读 · 0 评论 -
Solr分面搜索(Faceting)
分面搜索(faceting)是基于索引词,将搜索结果组织到不同的分类(categories)中。表示为索引词(terms),以及一个数值代表各个词匹配的文档数。*分面的字段属性:indexed或docValues之一必须为true, 但不是都必须为true. docValues在很多情况下更高效。(1) 通用参数- facet"true" 启用faceting计数。原创 2016-05-27 18:26:48 · 5325 阅读 · 2 评论 -
Solr搜索介绍(Searching)
1. 概览在Solr中运行一个搜索时,搜索查询(search query)由一个request handler处理。一个request handler是一个Solr插件,定义了Solr处理请求时使用的逻辑。Solr支持各种请求处理器。Search应用默认选择一个特定的request handler. 用户可以配置选择一个不同的request handler来覆盖默认的选择。原创 2016-05-27 18:18:48 · 4827 阅读 · 0 评论 -
Solr与开源中文分词(ansj)整合
1. ansj分词源码及jar包下载地址源码:https://github.com/NLPchina/ansj_segjar包:http://maven.nlpcn.org/org/ansj/http://maven.nlpcn.org/org/nlpcn/nlp-lang2. 在solr使用ansj分词(1) ansj的solr扩展及编译ansj支原创 2015-12-17 10:56:18 · 1630 阅读 · 0 评论 -
solr5安装实践
自带安装脚本./install_solr_service.sh -i /opt # 安装路径(需已存在)-d /var/solr # solr数据文件目录-u solr # 所属用户-s solr # 服务名-p 8983 # 运行端口安装命令$ tar xzf solr-5.5.0.tgz so原创 2016-04-29 11:19:33 · 1017 阅读 · 0 评论 -
用于solr5的ansj分词插件扩展
源码:https://github.com/NLPchina/ansj_segjar包:http://maven.nlpcn.org/org/ansj/http://maven.nlpcn.org/org/nlpcn/nlp-langhttp://maven.nlpcn.org/org/ansj/tree_split/生成solr5的ansj插件:下载ansj_原创 2016-05-17 17:56:11 · 1858 阅读 · 0 评论 -
文档(Documents), 字段(Fields), 及模式设计(Schema Design)
1. 文档(Documents), 字段(Fields), 及模式设计(Schema Design)1.1 概览1.1.1 Solr的Schema文件Solr在schema文件中存储它需要知道的字段类型和字段的详细信息。此文件的名称和位置,取决于你如何配置solr.- schema.xml 是schema文件的传统名称。- managed-schema 作为schema文件名,原创 2016-05-17 18:02:28 · 1417 阅读 · 0 评论 -
Solr5 Schema API
1. Schema APISchema API提供了对每个collection的schema的读写访问。对所有schema元素的读访问都支持。字段(Fields), dynamic fields, field types 和 copyField 可以被添加、删除或替代。未来Solr可能支持对更多schema元素的写操作。注意:一旦schema被修改,重新索引所有数据。原创 2016-05-17 18:05:23 · 1410 阅读 · 0 评论 -
Solr理解Analyzers, Tokenizers, and Filters.
1. 关于关于Solr如何切分文本数据。需要理解三个主要概念:analyzers, tokenizers, and filters.Field analyzers:在索引(index)单个文档和查询(query)时都被使用。它检查字段的文本并生成一个token stream. Analyzers可以是单个class或是由tokenizer和filter序列组成。Tokenizers原创 2016-05-19 14:36:47 · 3773 阅读 · 0 评论 -
Solr Ping
1. Solr服务端配置solrconfig.xml explicit 10 Name solrpingquery Name all 需要配置"df"属性,优先使用"/admin/ping"中的,Name是schema.xml中存在的字段(文本),否则原创 2014-12-13 11:38:20 · 1326 阅读 · 0 评论 -
Solr 使用中文分词
在Solr中使用中文分词原创 2014-09-11 11:35:52 · 650 阅读 · 0 评论 -
Solr源码配置运行
在Eclipse中配置Solr源码 hongweiyi.com/2013/03/configurate-solr-src-in-eclipse/将solr源码部署到本地机器运行 blog.csdn.net/awj3584/article/details/17223819 eclipse环境中调试solr源代码 www.cnblogs.com/sunshineKID/p/3445967转载 2015-01-12 16:30:15 · 704 阅读 · 0 评论 -
Solr源码导入Eclipse
进入源码目录:solr-4.9.0> ant ivy-bootstrap #下载ivy-xxx.jarsolr-4.9.0> ant eclipse耐心等待…………()原创 2014-09-16 13:22:31 · 568 阅读 · 0 评论 -
Lucene Query Parser Syntax
Lucene查询解析器语法关于包 org.apache.lucene.queryparser.classic 的描述一个简单的使用JavaCC实现的查询解析器。注意,因为JavaCC定义了很多没有必要成为public的public类,方法和值域,这使文档变得有些杂乱。Sorry. 注意,因为JavaCC定义了一个名为Token的类,org.apache.lucene.ana翻译 2014-08-14 22:03:51 · 1406 阅读 · 0 评论 -
Lucene Tutorials
Lucene各版本的演示程序(demo)副本,包含在相应的release文档中。Lucene 4.7.2 demo API =====================Packages:org.apache.lucene.demo 用于索引和搜索的演示应用程序org.apache.lucene.demo.facet 分面搜翻译 2014-08-14 21:54:49 · 727 阅读 · 0 评论 -
Apache Lucene Core
1. Apache Lucene CoreApache Lucene 是一个高性能、功能全面的搜索引擎库,完全由Java编写。这是一项几乎适合所有需要全文检索的应用程序的技术,尤其是跨平台应用。2. Lucene Features 特性(功能)通过简单的API提供强大的功能。可扩展,高性能索引. 在现代硬件索引速度超过 150G/hour . 较小RAM需求翻译 2014-08-14 21:52:35 · 1207 阅读 · 0 评论 -
Solr Tutorial
Solr指南* 版本: solr-4.7.21. 概览此文档通过使用一个示例模式(schema)和一些样本数据,涵盖了运行Solr的基本内容。2. 基本需求跟随这份指南,你将需要...(1) Java 1.6或更高. 你能从一些地方获取包括Oracle, Open JDK, 或IBM. 。在命令行运行java -version应该可以得到一个以翻译 2014-08-14 22:17:46 · 11300 阅读 · 0 评论 -
Apache Lucene 简介
Apache Lucene (TM) 项目开发开源搜索软件,包括:. Lucene Core, 旗舰子项目,提供基于Java的索引和搜索技术,以及拼写检查(spellchecking),命中高亮(hit highlighting)和高级分析/分词(analysis/tokenization)功能等。. Solr (TM) 是一个基于Lucene Core构建的高性能搜索服务器,翻译 2014-08-14 21:16:59 · 838 阅读 · 0 评论 -
Apache Solr
1. Apache SolrSolr是一个流行、发展迅速的开源企业搜索引擎平台,源自Apache Lucene项目。它的主要功能特征包括强大的全文检索(full-text search), 命中高亮(hit highlighting), 分面搜索(faceted search), 近乎实时地索引(near real-time indexing), 动态聚合(dynamic clusteri翻译 2014-08-14 22:12:20 · 858 阅读 · 0 评论 -
Solr文档 (官方资料)
Solr文档SolrDocumentationhttp://lucene.apache.org/solr/documentation.html Solr指南(Tutorial)http://lucene.apache.org/solr/tutorial.html 新用户鼓励从the Solrtutorial开始看。 每个版本的Solr都在其发布包的文档中包含一份翻译 2014-10-11 16:42:25 · 903 阅读 · 0 评论 -
Solr Replication (Wiki)
Solr Replication此文档描述Java实现的索引复制(备份),其基于HTTP工作并且包含在Solr1.4中。关于自Solr1.1以来基于ssh/rsync的备份功能的信息请参考CollectionDistribution. 注意对于Solr4.0中的SolrCloud,复制将以推送模式(push-style)完成,这种索引复制将不再需要。 特性备份无需外部脚本;只在翻译 2014-10-11 14:57:41 · 976 阅读 · 0 评论 -
Solr Replication 使用
Master配置------------ solrconfig.xml ---------- To enable simple master/slavereplication, uncomment one of the sections below, depending on whetherthis solr instance should原创 2014-10-14 13:05:30 · 735 阅读 · 0 评论 -
[Solr Wiki] New SolrCloud Design
http://wiki.apache.org/solr/NewSolrCloudDesign翻译 2014-11-04 17:10:18 · 700 阅读 · 0 评论 -
Solr + Tomcat部署
Solr + Tomcat部署1.复制solr.war到tomcat/webappssolr-4.9.0/example/webapps/solr.war …/apache-tomcat-8.0.9/webapps/(即solr-4.9.0/dist/solr-4.9.0.war) 2.修改tomcat/conf/server.xml(此步可忽略?)# vim …/apac原创 2014-08-15 17:57:40 · 1050 阅读 · 1 评论 -
Solr 创建索引
solr-4.9.0/example/solr/collection1是SolrCore的实例目录示例,当建立一个新的SolrCore时,并不是必须拷贝这个目录的所有文件,但推荐这样做。 基本目录结构-------------------------Solr主目录通常包含下面的子目录… conf/ 这个目录是必需的并且必须包含solrconfig.xml和s原创 2014-08-19 10:25:15 · 3985 阅读 · 0 评论 -
Solr索引和基本数据操作
1. 介绍Solr索引可以接收不同的数据来源,包括XML文件,逗号分隔值(CSV)文件,从数据库提取的数据,常见的文件格式如MS Word或PDF.有三种常用的方法加载数据到Solr索引:* 使用Apache Tika的Solr Cell框架,处理二进制或结构化文件如Office, Word, PDF 和其他专有格式。* 通过HTTP请求上传XML文件* 使用SolrJ写一原创 2016-05-20 13:32:51 · 4555 阅读 · 0 评论