- 博客(84)
- 收藏
- 关注
原创 solr定制文档hash
我们知道,solr在添加文档建索引的时候,通过文档id来进行hash到具体哪一个shard上去,从而实现一个Collection上的数据平衡性。但是这也有个弊端就是我们在做查询的时候,需要到每个shard并行查询,然后再将总结果返回,这一定程度上降低了性能。solr支持一个特性就是我们可以通过特殊标记文档id,将这类文档都建立在特定的shard上,然后查询的时候只需要设置下一个参数...
2017-08-18 19:27:26
182
原创 Distributed Requests
Distributed RequestsQuery all shards of a collection (the collection is implicit in the URL): http://localhost:8983/solr/collection1/select?Query all shards of a compatible collection, explic...
2017-08-15 13:22:17
142
原创 collection async
Asynchronous CallsSince some collection API calls can be long running tasks e.g. Shard Split, you can optionally have the calls run asynchronously. Specifying async=<request-id> enables ...
2017-08-14 16:43:45
146
原创 Collections API timeouts
Such timeout can occur when Solr is not able to obtain cluster state. If following call is results in timeout, then this is the casehttp://solr-hostname:8983/solr/admin/collections?action=CLUSTERST...
2017-08-13 00:32:18
173
原创 apache权限问题
[root@localhost ~]# service httpd restart停止 httpd: [失败]正在启动 httpd:Syntax error on line 293 of /etc/httpd/conf/httpd.conf:DocumentRoot must be a directory[失败][root@localhost ~]# service httpd rest...
2015-01-09 14:30:57
244
原创 Solr原子更新
Solr4.0开始支持简单的原子更新和添加字段 参数说明Solr支持多种修饰符,自动更新文档的值。set – 更新一个字段add – 添加一个字段inc – 在原有值的基础上增加(看下面的例子更清楚)备注: 所有原始字段必须存储(在fieldType 里面设置 stored=true) 操作例子第一步、添加一条数据$ curl http://...
2014-12-30 17:13:31
114
原创 solr分组聚合
在大型电子商务网站中,在商品列表页,我们都可以看到商品按分类,品牌,价格的分类显示,如下图,这些我们可以使用solr中的facet功能实现。 facet的基本功能就是对搜索结果中的商品进行分类。 1.facet用法 facet.field:指定要分类的字段 facet=on 或 facet=true表示功能开启 facet...
2014-12-30 17:12:00
380
原创 如何把jar包发布到maven私服
1.格式 mvn deploy:deploy-file -DgroupId=com.qiyi -DartifactId=sphinx -Dversion=1.0 -Dpackaging=jar -Dfile=D:\sphinxapi.jar -Durl=[url] -DrepositoryId=[id2.实例D:\develop\apache-maven-3.0.4\bin>...
2014-12-16 16:58:13
206
原创 ImageMagick安装
参考:http://xupo.iteye.com/blog/1134986 http://logo32.blog.163.com/blog/static/668116902012825105651961/ 检查一些依赖包的安装,通过yum来安装,如果Redhat5无法用yum,参考本人的另一篇文章:RHEL5 利用 CentOS的yum 安装openssl gc++及Ngi...
2013-04-07 01:41:22
118
原创 document解析xml
示例:----------------------------------------------------------config.xml<?xml version="1.0" encoding="GBK"?><param> <add name="pageSize" value="15">page</add
2013-02-25 23:21:00
97
原创 servlet读取xml格式的post数据
服务器端代码: [java] view plaincopyrundata.getModuleInfo().setLayoutTemplate(null); HttpServletRequest request = rundata.getRequest(); HttpServletR...
2013-02-25 22:25:01
201
原创 passbook定位问题
passbook通过gps定位,查看你passbook中是否在这个坐标附近有pass。 原理是这样,不需要通程网络,直接提醒你你下载的这个附近的pass。 但是gps定位和google地图的坐标会有一个的偏移 如果两个坐标规格不一样的话,算出来的结果也是会有偏差的,时常会发现标注的是这个附,而不提醒的状况。 所以,需要转换坐标,把地图上标注的坐标转换成gps规格的坐...
2012-12-10 17:27:29
142
原创 mac上更改jdk
mac 更改jdk其实只要把软链改一下就行 /usr/bin/java指向的是/System/Library/Frameworks/JavaVM.framework/Versions/Current这个软链只要把这个软链指向到你想要的jdk版本就行 sudo ln -s 1.5.0-leopard Current...
2012-12-05 16:45:22
153
原创 lbs中从库中查询某经纬度2KM范围内的数据
sql语句查询经纬度范围指定一个经纬度,给定一个范围值(单位:千米),查出在经纬度周围这个范围内的数据。 经度:113.914619 纬度:22.50128 范围:2km longitude为数据表经度字段 latitude为数据表纬度字段 SQL在mysql下测试通过,其他数据库可能需要修改 SQL语句如下: select * from location where sqrt( (...
2012-11-02 12:44:39
162
原创 12年2月jhost邀请码
jhost是一个免费的jsp空间 给一个邀请码:20120326215259_571813,有效期至:2012-03-26 21:52:59
2012-02-26 21:58:54
462
原创 intellij idea 结合 tomcat 完成自动编译
之前一直在寻找intellij idea 能像eclipse自动帮完成编译与部署的方法,试用过很多方法,都不是那么完美。 今天在试用intellij idea 11时,惊讶的发现,在idea失去焦点时会自动编译与部置,只要一个小小的设置。 在tomcat设置窗口,把 on update action 和 on frame deactivation 两项都选择 update cla...
2012-01-17 20:00:04
507
原创 jsp:include, include指令和<c:import/>,cookie
<jsp:include page=""/> action和<c:import url=""/> jstl tag都是动态加载。但是c:import则更为灵活。jsp:include只能include当前web app下的页面,而c:import则可以从外部容器加载内容。 动态加载和静态加载最根本的不同在于,jsp生成的servlet的不同。在tomcat下静态...
2011-04-19 21:05:21
183
原创 solr 空格关键词
在应用中,可能会遇到英文短语作为一个检索词进行索引,而索引的分词也是短语分词或string分词。因为英文短语间会有空格,而用solr检索时会把空格转变为+号,就成了两个词联合检索,用什么方法可以避免形成两个词?...
2011-03-16 22:57:31
445
原创 IK自定义词库
ik 支持api级的用户词库加载,和配置级的词库文件指定,无 BOM 的 UTF-8 编码,\r\n 分割。不支持自动检测。 在类org.wltea.analyzer.dic.Dictionary下,有loadExtendWords和loadExtendStopWords这两个方法来扩展词库...
2011-01-13 14:30:01
163
原创 解决Tomcat Too Many Open Files问题
这个问题是第一次在Linux环境下碰到,把解决的方法记录下来。服务器配置:两个双核CPU 2.0G,4G内存操作系统:CentOS,内核2.6.18应用1、搜索服务器,负责全站的搜索和提供内容相关性接口应用服务器:Tomcat6.0.16+Apache2.2.8,其中两个Tomcat实例,一个对外提供服务,一个对内管理索引(创建、删除、检索等)Web方案:Solr1.3(WithSolr ...
2010-12-27 10:07:12
135
原创 solr 查询参数说明
常用 q - 查询字符串,必须的。 fl - 指定返回那些字段内容,用逗号或空格分隔多个。 start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。 rows - 指定返回结果最多有多少条记录,配合start来实现分页。 sort - 排序,格式:sort=<fieldname>+<desc|asc>[,<field na...
2010-12-27 10:05:41
107
原创 solrJ查询使用方法
public class SolrJSearch { private static final String SOLR_URL = //"http://10.0.8.10:8081/solr/spacearticle/"; "http://localhost:8080/solr/"; pri...
2010-12-27 10:05:01
110
原创 solr的复制功能
参考朋友chenlb的文章:http://www.iteye.com/topic/211807,谢谢! solr的复制功能可以把创建索引和search分离开来,可以像一台主服务器发送http请求创建索引,创建完了,利用linux crontab定时功能,实现向多台索引服务器的replicate。实现索引的同步。 要在solr里配置索引段位2个,这样每次都是事复制最新新增加的索引过去,而...
2010-12-27 10:03:31
173
原创 solr更换memcached缓存的方法
1、补丁文件2个,src/java/org/apache/solr/search/DocSet.java,src/java/org/apache/solr/search/QueryResultKey.java。 2、把 solr-memcache 安装使用上。把apapache-solr-memcache-1.3.0.jar 和依赖的 memcached-2.2.jar、spy-2.4.j...
2010-12-27 09:56:32
93
原创 Solr调优
Schema设计的思考 索引字段的数量(Indexed Fields) 索引字段会增加如下开销: <!--[if !supportLists]-->1. <!--[endif]-->建立索引时的内存使用率 <!--[if !supportLists]-->2. <!--[endif]-->Segment合并时间 ...
2010-12-27 09:54:56
127
原创 solr的一些查询语法
Solr 及 lucene 的 query 使用方法初級解說 1. 首先假設我的資料裡fields有:name,subbranch, tel, address 預設的搜尋是name這個欄位, 如果要搜尋的資料剛好就是 name 這個欄位,就不需要指定搜尋欄位名稱. 2. 查詢規則: 如欲查詢特定欄位(非預設欄位),請在查詢詞前加上該欄位名稱加 “:” (不包含”號) 符號, 例如...
2010-12-27 09:54:08
113
原创 Solr的检索运算符
“:” 指定字段查指定值,如返回所有值*:*² “?” 表示单个任意字符的通配² “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)² “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。² 邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”...
2010-12-27 09:53:23
120
原创 查找相似页面
MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。提交新查询就会返回其他查询结果。所有这些都可以用检索词向量来完成:只需将 termVectors="true" 添加到 schema.xml 中的 <field> 声明。 在 Google 上尝试一个查询,...
2010-12-27 09:52:39
233
原创 solr 1.3 更多扩展点
在 Solr 1.3 中,扩展 Solr 以及配置和重新整理扩展变得十分简单。以前,您需要编写一个SolrRequestHandler 来实现新功能。这个方法的问题是其他 SolrRequestHandler很难重用该功能。例如,您可能有更好的分类方法,但却想保留现有的查询与突出显示功能。为了解决这个问题,Solr 项目提出了将各种 SolrRequestHandler(比如Stand...
2010-12-27 09:51:51
95
原创 solr一些概念
一、 醒目显示的查询参数1. q Solr 中用来搜索的查询。有关该语法的完整描述,请参阅参考资料 中的 “Lucene QueryParser Syntax”。可以通过追加一个分号和已索引且未进行断词的字段(下面会进行解释)的名称来包含排序信息。默认的排序是 score desc,指按记分降序排序。 q=myField:Java ANDotherField:developerWorks;...
2010-12-27 09:50:30
93
原创 solr1.3 multicore + tomcat5.5 + paoding分词安装
一.安装jdk6,tomcat5.5。 二.解压solr1.3,创建以下目录: /usr/local/solr/solrApps: 保存的是solr.war /usr/local/solr/multicore : 保存的是多核 solr的配制文件 拷贝solr1.3解压目录里的dist/apache-solr-1.3.0.war到solrApps里,example/mult...
2010-12-27 09:49:39
102
原创 solr的distribution搜索
1.安装2个solr,2份tomcat,端口一个为8080,一个为9080 2.最方便的配置是在url里增加distribution搜索:&shards=localhost:8080/solr,localhost:9080/solr 完全URL为: http://localhost:9080/solr/select/?q=AllField%3A%E5%B0%8F%E8%...
2010-12-27 09:38:48
156
原创 solr 竞价
Configurationsolrconfig.xmlThe query elevation component is configured in solrconfig.xml. Atypical configuration may look like: <searchComponent name="elevator" class="org.apache.solr...
2010-12-27 09:37:34
172
原创 solr 查询 排序
Querying Data 查询没什么可说的。大致看看就明白。 q是查询关键字。fl是返回哪些结果集的字段。结果集是一个xml文档。 引用Searches are done via HTTP GET on the select URL with the query string in the qparameter. You can pass a number of opt...
2010-12-27 09:35:43
96
原创 Chrome 对document.documentElement.scrollTop不识别
最近做一个瞬间信息显示浮动层时,IE、Firefox下都能显示正常,但Chrome下出现了浮动层永远显示在上面,经过仔细分析,发现Chrome对document.documentElement.scrollTop的识别会出现误差。不过加上document.body.scrollTop后,则显示正常。 网友提示:由于document.documentElement.sc...
2010-12-08 15:22:17
127
原创 当前几个主要的Lucene中文分词器的比较
原文地址:http://blog.fulin.org/2009/08/lucene_chinese_analyzer_compare.html1. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中...
2010-11-16 16:06:23
67
原创 mysql full join
create table tab11(id int,`name` varchar(3));create table tab22 (id int,`name` varchar(3));insert into tab11 values(1,'tt1'),(2,'tt2'),(4,'tt4');insert into tab22 values(3,'tt3'),(5,'t...
2010-11-02 17:23:25
59
原创 iphone开发
http://cocoachina.com/ 大量iPhone开发资料,教学,经验,还有自曝。 http://www.iteye.com/forums/board/mobile iPhone开发论坛,人气鼎盛,大量自曝,还有Android的讨论 http://developer.apple.com/iphone/ 苹果iPhone开发官方主页,提供大量实例、文档和教学视频 http://www.s...
2010-10-26 15:51:40
81
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人