solr
文章平均质量分 54
yaljj84
这个作者很懒,什么都没留下…
展开
-
Lucene实现在检索结果中再检索
Lucene是可以做到的,利用lucene的Filter,具体可以查看lucene的api中的org.apache.lucene.search.CachingWrapperFilter,它可以缓存上次的搜索结果,从而实现在结果中的搜索。测试实例:package com.wsjava;import java.io.IOException;import org.apache.lucene.analys...2009-12-04 17:56:45 · 132 阅读 · 0 评论 -
solr的复制功能
参考朋友chenlb的文章:http://www.iteye.com/topic/211807,谢谢! solr的复制功能可以把创建索引和search分离开来,可以像一台主服务器发送http请求创建索引,创建完了,利用linux crontab定时功能,实现向多台索引服务器的replicate。实现索引的同步。 要在solr里配置索引段位2个,这样每次都是事复制最新新增加的索引过去,而...原创 2010-12-27 10:03:31 · 166 阅读 · 0 评论 -
solrJ查询使用方法
public class SolrJSearch { private static final String SOLR_URL = //"http://10.0.8.10:8081/solr/spacearticle/"; "http://localhost:8080/solr/"; pri...原创 2010-12-27 10:05:01 · 108 阅读 · 0 评论 -
solr 查询参数说明
常用 q - 查询字符串,必须的。 fl - 指定返回那些字段内容,用逗号或空格分隔多个。 start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。 rows - 指定返回结果最多有多少条记录,配合start来实现分页。 sort - 排序,格式:sort=<fieldname>+<desc|asc>[,<field na...原创 2010-12-27 10:05:41 · 103 阅读 · 0 评论 -
解决Tomcat Too Many Open Files问题
这个问题是第一次在Linux环境下碰到,把解决的方法记录下来。服务器配置:两个双核CPU 2.0G,4G内存操作系统:CentOS,内核2.6.18应用1、搜索服务器,负责全站的搜索和提供内容相关性接口应用服务器:Tomcat6.0.16+Apache2.2.8,其中两个Tomcat实例,一个对外提供服务,一个对内管理索引(创建、删除、检索等)Web方案:Solr1.3(WithSolr ...原创 2010-12-27 10:07:12 · 133 阅读 · 0 评论 -
IK自定义词库
ik 支持api级的用户词库加载,和配置级的词库文件指定,无 BOM 的 UTF-8 编码,\r\n 分割。不支持自动检测。 在类org.wltea.analyzer.dic.Dictionary下,有loadExtendWords和loadExtendStopWords这两个方法来扩展词库...原创 2011-01-13 14:30:01 · 161 阅读 · 0 评论 -
索引排序
solr 后添加的索引或修改后的索引,在搜索时排到后面去了,有什么方法可以避免这种情况?原创 2011-03-14 00:21:59 · 89 阅读 · 0 评论 -
当前几个主要的Lucene中文分词器的比较
原文地址:http://blog.fulin.org/2009/08/lucene_chinese_analyzer_compare.html1. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中...原创 2010-11-16 16:06:23 · 67 阅读 · 0 评论 -
solr 空格关键词
在应用中,可能会遇到英文短语作为一个检索词进行索引,而索引的分词也是短语分词或string分词。因为英文短语间会有空格,而用solr检索时会把空格转变为+号,就成了两个词联合检索,用什么方法可以避免形成两个词?...原创 2011-03-16 22:57:31 · 439 阅读 · 0 评论 -
solr分组聚合
在大型电子商务网站中,在商品列表页,我们都可以看到商品按分类,品牌,价格的分类显示,如下图,这些我们可以使用solr中的facet功能实现。 facet的基本功能就是对搜索结果中的商品进行分类。 1.facet用法 facet.field:指定要分类的字段 facet=on 或 facet=true表示功能开启 facet...原创 2014-12-30 17:12:00 · 377 阅读 · 0 评论 -
Solr原子更新
Solr4.0开始支持简单的原子更新和添加字段 参数说明Solr支持多种修饰符,自动更新文档的值。set – 更新一个字段add – 添加一个字段inc – 在原有值的基础上增加(看下面的例子更清楚)备注: 所有原始字段必须存储(在fieldType 里面设置 stored=true) 操作例子第一步、添加一条数据$ curl http://...原创 2014-12-30 17:13:31 · 103 阅读 · 0 评论 -
Collections API timeouts
Such timeout can occur when Solr is not able to obtain cluster state. If following call is results in timeout, then this is the casehttp://solr-hostname:8983/solr/admin/collections?action=CLUSTERST...原创 2017-08-13 00:32:18 · 167 阅读 · 0 评论 -
collection async
Asynchronous CallsSince some collection API calls can be long running tasks e.g. Shard Split, you can optionally have the calls run asynchronously. Specifying async=<request-id> enables ...原创 2017-08-14 16:43:45 · 142 阅读 · 0 评论 -
Distributed Requests
Distributed RequestsQuery all shards of a collection (the collection is implicit in the URL): http://localhost:8983/solr/collection1/select?Query all shards of a compatible collection, explic...原创 2017-08-15 13:22:17 · 133 阅读 · 0 评论 -
solr更换memcached缓存的方法
1、补丁文件2个,src/java/org/apache/solr/search/DocSet.java,src/java/org/apache/solr/search/QueryResultKey.java。 2、把 solr-memcache 安装使用上。把apapache-solr-memcache-1.3.0.jar 和依赖的 memcached-2.2.jar、spy-2.4.j...原创 2010-12-27 09:56:32 · 90 阅读 · 0 评论 -
Solr调优
Schema设计的思考 索引字段的数量(Indexed Fields) 索引字段会增加如下开销: <!--[if !supportLists]-->1. <!--[endif]-->建立索引时的内存使用率 <!--[if !supportLists]-->2. <!--[endif]-->Segment合并时间 ...原创 2010-12-27 09:54:56 · 125 阅读 · 0 评论 -
solr的一些查询语法
Solr 及 lucene 的 query 使用方法初級解說 1. 首先假設我的資料裡fields有:name,subbranch, tel, address 預設的搜尋是name這個欄位, 如果要搜尋的資料剛好就是 name 這個欄位,就不需要指定搜尋欄位名稱. 2. 查詢規則: 如欲查詢特定欄位(非預設欄位),請在查詢詞前加上該欄位名稱加 “:” (不包含”號) 符號, 例如...原创 2010-12-27 09:54:08 · 111 阅读 · 0 评论 -
solr facet 分组查询
最近再用apache的solr,觉得很好用现在用它实现一个分组查询public static Map<String, Integer> queryByGroup(String qStr,String groupField,String sortField,boolean asc,Integer pageSize,Integer pageNum){ Map<Strin...2010-03-24 11:26:20 · 193 阅读 · 0 评论 -
solrconfig 解说
solrconfig.xml文件包含了大部分的参数用来配置Solr本身的。 dataDir parameter:<dataDir>/var/data/solr</dataDir> 用来指定一个替换原先在Solr目录下默认存放所有的索引数据,可以在Solr目录以外的任意目录中。如果复制使用后应该符合该参数。如果这个目录不是绝对路径的话,那么应该以当前的容器为相对路径。 ...2010-03-25 14:42:21 · 60 阅读 · 0 评论 -
Solr的配置
主要有两个配置文件,都位于Solr的&Solr Home/conf文件夹下solrconfig.xml 和 schema.xml一。solrconfig.xml:1.dataDir parameter,索引文件的存储目录。如果不设置,则默认是&Solr Home/data文件夹。如果指定的不是绝对路径,那么路径就是 web server下的相对路径。2.indexDefau...2009-02-05 13:51:03 · 72 阅读 · 0 评论 -
solr1.4博文收集
SolrReplication 试用http://blog.chenlb.com/2009/07/try-solr-replication.html讲了分布式索引实现方法配置http://www.iteye.com/topic/525927讲了如何配置solr 更新ing ...........2009-12-16 21:33:43 · 65 阅读 · 0 评论 -
solr 搜索
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果; Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实...2009-08-17 14:21:20 · 86 阅读 · 0 评论 -
solr 查询 排序
Querying Data 查询没什么可说的。大致看看就明白。 q是查询关键字。fl是返回哪些结果集的字段。结果集是一个xml文档。 引用Searches are done via HTTP GET on the select URL with the query string in the qparameter. You can pass a number of opt...原创 2010-12-27 09:35:43 · 93 阅读 · 0 评论 -
solr 竞价
Configurationsolrconfig.xmlThe query elevation component is configured in solrconfig.xml. Atypical configuration may look like: <searchComponent name="elevator" class="org.apache.solr...原创 2010-12-27 09:37:34 · 165 阅读 · 0 评论 -
solr的distribution搜索
1.安装2个solr,2份tomcat,端口一个为8080,一个为9080 2.最方便的配置是在url里增加distribution搜索:&shards=localhost:8080/solr,localhost:9080/solr 完全URL为: http://localhost:9080/solr/select/?q=AllField%3A%E5%B0%8F%E8%...原创 2010-12-27 09:38:48 · 155 阅读 · 0 评论 -
solr1.3 multicore + tomcat5.5 + paoding分词安装
一.安装jdk6,tomcat5.5。 二.解压solr1.3,创建以下目录: /usr/local/solr/solrApps: 保存的是solr.war /usr/local/solr/multicore : 保存的是多核 solr的配制文件 拷贝solr1.3解压目录里的dist/apache-solr-1.3.0.war到solrApps里,example/mult...原创 2010-12-27 09:49:39 · 99 阅读 · 0 评论 -
solr一些概念
一、 醒目显示的查询参数1. q Solr 中用来搜索的查询。有关该语法的完整描述,请参阅参考资料 中的 “Lucene QueryParser Syntax”。可以通过追加一个分号和已索引且未进行断词的字段(下面会进行解释)的名称来包含排序信息。默认的排序是 score desc,指按记分降序排序。 q=myField:Java ANDotherField:developerWorks;...原创 2010-12-27 09:50:30 · 93 阅读 · 0 评论 -
solr 1.3 更多扩展点
在 Solr 1.3 中,扩展 Solr 以及配置和重新整理扩展变得十分简单。以前,您需要编写一个SolrRequestHandler 来实现新功能。这个方法的问题是其他 SolrRequestHandler很难重用该功能。例如,您可能有更好的分类方法,但却想保留现有的查询与突出显示功能。为了解决这个问题,Solr 项目提出了将各种 SolrRequestHandler(比如Stand...原创 2010-12-27 09:51:51 · 91 阅读 · 0 评论 -
查找相似页面
MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。提交新查询就会返回其他查询结果。所有这些都可以用检索词向量来完成:只需将 termVectors="true" 添加到 schema.xml 中的 <field> 声明。 在 Google 上尝试一个查询,...原创 2010-12-27 09:52:39 · 229 阅读 · 0 评论 -
Solr的检索运算符
“:” 指定字段查指定值,如返回所有值*:*² “?” 表示单个任意字符的通配² “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)² “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。² 邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”...原创 2010-12-27 09:53:23 · 115 阅读 · 0 评论 -
solr定制文档hash
我们知道,solr在添加文档建索引的时候,通过文档id来进行hash到具体哪一个shard上去,从而实现一个Collection上的数据平衡性。但是这也有个弊端就是我们在做查询的时候,需要到每个shard并行查询,然后再将总结果返回,这一定程度上降低了性能。solr支持一个特性就是我们可以通过特殊标记文档id,将这类文档都建立在特定的shard上,然后查询的时候只需要设置下一个参数...原创 2017-08-18 19:27:26 · 177 阅读 · 0 评论