自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(84)
  • 收藏
  • 关注

原创 solr定制文档hash

我们知道,solr在添加文档建索引的时候,通过文档id来进行hash到具体哪一个shard上去,从而实现一个Collection上的数据平衡性。但是这也有个弊端就是我们在做查询的时候,需要到每个shard并行查询,然后再将总结果返回,这一定程度上降低了性能。solr支持一个特性就是我们可以通过特殊标记文档id,将这类文档都建立在特定的shard上,然后查询的时候只需要设置下一个参数...

2017-08-18 19:27:26 182

原创 Distributed Requests

Distributed RequestsQuery all shards of a collection (the collection is implicit in the URL): http://localhost:8983/solr/collection1/select?Query all shards of a compatible collection, explic...

2017-08-15 13:22:17 142

原创 collection async

Asynchronous CallsSince some collection API calls can be long running tasks e.g. Shard Split, you can optionally have the calls run asynchronously. Specifying async=<request-id> enables ...

2017-08-14 16:43:45 146

原创 Collections API timeouts

Such timeout can occur when Solr is not able to obtain cluster state. If following call is results in timeout, then this is the casehttp://solr-hostname:8983/solr/admin/collections?action=CLUSTERST...

2017-08-13 00:32:18 173

原创 apache权限问题

[root@localhost ~]# service httpd restart停止 httpd: [失败]正在启动 httpd:Syntax error on line 293 of /etc/httpd/conf/httpd.conf:DocumentRoot must be a directory[失败][root@localhost ~]# service httpd rest...

2015-01-09 14:30:57 244

原创 Solr原子更新

Solr4.0开始支持简单的原子更新和添加字段 参数说明Solr支持多种修饰符,自动更新文档的值。set – 更新一个字段add – 添加一个字段inc – 在原有值的基础上增加(看下面的例子更清楚)备注: 所有原始字段必须存储(在fieldType 里面设置 stored=true) 操作例子第一步、添加一条数据$ curl http://...

2014-12-30 17:13:31 114

原创 solr分组聚合

在大型电子商务网站中,在商品列表页,我们都可以看到商品按分类,品牌,价格的分类显示,如下图,这些我们可以使用solr中的facet功能实现。   facet的基本功能就是对搜索结果中的商品进行分类。    1.facet用法       facet.field:指定要分类的字段       facet=on 或 facet=true表示功能开启       facet...

2014-12-30 17:12:00 380

原创 如何把jar包发布到maven私服

1.格式 mvn deploy:deploy-file -DgroupId=com.qiyi -DartifactId=sphinx -Dversion=1.0 -Dpackaging=jar -Dfile=D:\sphinxapi.jar -Durl=[url] -DrepositoryId=[id2.实例D:\develop\apache-maven-3.0.4\bin>...

2014-12-16 16:58:13 206

原创 ImageMagick安装

参考:http://xupo.iteye.com/blog/1134986   http://logo32.blog.163.com/blog/static/668116902012825105651961/  检查一些依赖包的安装,通过yum来安装,如果Redhat5无法用yum,参考本人的另一篇文章:RHEL5 利用 CentOS的yum 安装openssl gc++及Ngi...

2013-04-07 01:41:22 118

原创 document解析xml

示例:----------------------------------------------------------config.xml<?xml version="1.0" encoding="GBK"?><param> <add name="pageSize" value="15">page</add

2013-02-25 23:21:00 97

原创 servlet读取xml格式的post数据

 服务器端代码:  [java] view plaincopyrundata.getModuleInfo().setLayoutTemplate(null);                    HttpServletRequest request = rundata.getRequest();          HttpServletR...

2013-02-25 22:25:01 201

原创 passbook定位问题

passbook通过gps定位,查看你passbook中是否在这个坐标附近有pass。 原理是这样,不需要通程网络,直接提醒你你下载的这个附近的pass。 但是gps定位和google地图的坐标会有一个的偏移 如果两个坐标规格不一样的话,算出来的结果也是会有偏差的,时常会发现标注的是这个附,而不提醒的状况。 所以,需要转换坐标,把地图上标注的坐标转换成gps规格的坐...

2012-12-10 17:27:29 142

原创 mac上更改jdk

mac 更改jdk其实只要把软链改一下就行 /usr/bin/java指向的是/System/Library/Frameworks/JavaVM.framework/Versions/Current这个软链只要把这个软链指向到你想要的jdk版本就行 sudo ln -s 1.5.0-leopard Current...

2012-12-05 16:45:22 153

原创 lbs中从库中查询某经纬度2KM范围内的数据

 sql语句查询经纬度范围指定一个经纬度,给定一个范围值(单位:千米),查出在经纬度周围这个范围内的数据。 经度:113.914619 纬度:22.50128 范围:2km longitude为数据表经度字段 latitude为数据表纬度字段 SQL在mysql下测试通过,其他数据库可能需要修改 SQL语句如下: select * from location where sqrt( (...

2012-11-02 12:44:39 162

原创 ssh scp 带端品

ssh user@IP -p portscp -P port file user@IP:file

2012-08-07 14:52:59 85

原创 12年2月jhost邀请码

 jhost是一个免费的jsp空间 给一个邀请码:20120326215259_571813,有效期至:2012-03-26 21:52:59

2012-02-26 21:58:54 462

原创 intellij idea 结合 tomcat 完成自动编译

之前一直在寻找intellij idea 能像eclipse自动帮完成编译与部署的方法,试用过很多方法,都不是那么完美。 今天在试用intellij idea 11时,惊讶的发现,在idea失去焦点时会自动编译与部置,只要一个小小的设置。 在tomcat设置窗口,把 on update action 和 on frame deactivation 两项都选择 update cla...

2012-01-17 20:00:04 507

原创 jsp:include, include指令和<c:import/>,cookie

&lt;jsp:include page=""/&gt; action和&lt;c:import url=""/&gt; jstl tag都是动态加载。但是c:import则更为灵活。jsp:include只能include当前web app下的页面,而c:import则可以从外部容器加载内容。 动态加载和静态加载最根本的不同在于,jsp生成的servlet的不同。在tomcat下静态...

2011-04-19 21:05:21 183

原创 solr 空格关键词

在应用中,可能会遇到英文短语作为一个检索词进行索引,而索引的分词也是短语分词或string分词。因为英文短语间会有空格,而用solr检索时会把空格转变为+号,就成了两个词联合检索,用什么方法可以避免形成两个词?...

2011-03-16 22:57:31 445

原创 索引排序

solr 后添加的索引或修改后的索引,在搜索时排到后面去了,有什么方法可以避免这种情况?

2011-03-14 00:21:59 89

原创 IK自定义词库

ik 支持api级的用户词库加载,和配置级的词库文件指定,无 BOM 的 UTF-8 编码,\r\n 分割。不支持自动检测。 在类org.wltea.analyzer.dic.Dictionary下,有loadExtendWords和loadExtendStopWords这两个方法来扩展词库...

2011-01-13 14:30:01 163

原创 解决Tomcat Too Many Open Files问题

这个问题是第一次在Linux环境下碰到,把解决的方法记录下来。服务器配置:两个双核CPU 2.0G,4G内存操作系统:CentOS,内核2.6.18应用1、搜索服务器,负责全站的搜索和提供内容相关性接口应用服务器:Tomcat6.0.16+Apache2.2.8,其中两个Tomcat实例,一个对外提供服务,一个对内管理索引(创建、删除、检索等)Web方案:Solr1.3(WithSolr ...

2010-12-27 10:07:12 135

原创 solr 查询参数说明

常用 q - 查询字符串,必须的。 fl - 指定返回那些字段内容,用逗号或空格分隔多个。 start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。 rows - 指定返回结果最多有多少条记录,配合start来实现分页。 sort - 排序,格式:sort=&lt;fieldname&gt;+&lt;desc|asc&gt;[,&lt;field na...

2010-12-27 10:05:41 107

原创 solrJ查询使用方法

public class SolrJSearch { private static final String SOLR_URL = //"http://10.0.8.10:8081/solr/spacearticle/"; "http://localhost:8080/solr/"; pri...

2010-12-27 10:05:01 110

原创 solr的复制功能

参考朋友chenlb的文章:http://www.iteye.com/topic/211807,谢谢!     solr的复制功能可以把创建索引和search分离开来,可以像一台主服务器发送http请求创建索引,创建完了,利用linux crontab定时功能,实现向多台索引服务器的replicate。实现索引的同步。 要在solr里配置索引段位2个,这样每次都是事复制最新新增加的索引过去,而...

2010-12-27 10:03:31 173

原创 solr更换memcached缓存的方法

1、补丁文件2个,src/java/org/apache/solr/search/DocSet.java,src/java/org/apache/solr/search/QueryResultKey.java。 2、把 solr-memcache 安装使用上。把apapache-solr-memcache-1.3.0.jar 和依赖的 memcached-2.2.jar、spy-2.4.j...

2010-12-27 09:56:32 93

原创 Solr调优

Schema设计的思考 索引字段的数量(Indexed Fields) 索引字段会增加如下开销: &lt;!--[if !supportLists]--&gt;1.      &lt;!--[endif]--&gt;建立索引时的内存使用率 &lt;!--[if !supportLists]--&gt;2.      &lt;!--[endif]--&gt;Segment合并时间 ...

2010-12-27 09:54:56 127

原创 solr的一些查询语法

Solr 及 lucene 的 query 使用方法初級解說 1. 首先假設我的資料裡fields有:name,subbranch, tel, address 預設的搜尋是name這個欄位, 如果要搜尋的資料剛好就是 name 這個欄位,就不需要指定搜尋欄位名稱. 2. 查詢規則: 如欲查詢特定欄位(非預設欄位),請在查詢詞前加上該欄位名稱加 “:” (不包含”號) 符號, 例如...

2010-12-27 09:54:08 113

原创 Solr的检索运算符

“:” 指定字段查指定值,如返回所有值*:*²  “?” 表示单个任意字符的通配²  “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)²  “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。²  邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”...

2010-12-27 09:53:23 120

原创 查找相似页面

MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。提交新查询就会返回其他查询结果。所有这些都可以用检索词向量来完成:只需将 termVectors="true" 添加到 schema.xml 中的 &lt;field&gt; 声明。 在 Google 上尝试一个查询,...

2010-12-27 09:52:39 233

原创 solr 1.3 更多扩展点

在 Solr 1.3 中,扩展 Solr 以及配置和重新整理扩展变得十分简单。以前,您需要编写一个SolrRequestHandler 来实现新功能。这个方法的问题是其他 SolrRequestHandler很难重用该功能。例如,您可能有更好的分类方法,但却想保留现有的查询与突出显示功能。为了解决这个问题,Solr 项目提出了将各种 SolrRequestHandler(比如Stand...

2010-12-27 09:51:51 95

原创 solr一些概念

一、 醒目显示的查询参数1. q Solr 中用来搜索的查询。有关该语法的完整描述,请参阅参考资料 中的 “Lucene QueryParser Syntax”。可以通过追加一个分号和已索引且未进行断词的字段(下面会进行解释)的名称来包含排序信息。默认的排序是 score desc,指按记分降序排序。 q=myField:Java ANDotherField:developerWorks;...

2010-12-27 09:50:30 93

原创 solr1.3 multicore + tomcat5.5 + paoding分词安装

一.安装jdk6,tomcat5.5。 二.解压solr1.3,创建以下目录:   /usr/local/solr/solrApps: 保存的是solr.war   /usr/local/solr/multicore  : 保存的是多核 solr的配制文件 拷贝solr1.3解压目录里的dist/apache-solr-1.3.0.war到solrApps里,example/mult...

2010-12-27 09:49:39 102

原创 solr的distribution搜索

1.安装2个solr,2份tomcat,端口一个为8080,一个为9080 2.最方便的配置是在url里增加distribution搜索:&amp;shards=localhost:8080/solr,localhost:9080/solr 完全URL为:  http://localhost:9080/solr/select/?q=AllField%3A%E5%B0%8F%E8%...

2010-12-27 09:38:48 156

原创 solr 竞价

Configurationsolrconfig.xmlThe query elevation component is configured in solrconfig.xml. Atypical configuration may look like:  &lt;searchComponent name="elevator" class="org.apache.solr...

2010-12-27 09:37:34 172

原创 solr 查询 排序

Querying Data 查询没什么可说的。大致看看就明白。 q是查询关键字。fl是返回哪些结果集的字段。结果集是一个xml文档。 引用Searches are done via HTTP GET on the select URL with the query string in the qparameter. You can pass a number of opt...

2010-12-27 09:35:43 96

原创 Chrome 对document.documentElement.scrollTop不识别

        最近做一个瞬间信息显示浮动层时,IE、Firefox下都能显示正常,但Chrome下出现了浮动层永远显示在上面,经过仔细分析,发现Chrome对document.documentElement.scrollTop的识别会出现误差。不过加上document.body.scrollTop后,则显示正常。  网友提示:由于document.documentElement.sc...

2010-12-08 15:22:17 127

原创 当前几个主要的Lucene中文分词器的比较

原文地址:http://blog.fulin.org/2009/08/lucene_chinese_analyzer_compare.html1. 基本介绍:paoding :Lucene中文分词“庖丁解牛” Paoding Analysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中...

2010-11-16 16:06:23 67

原创 mysql full join

create table tab11(id int,`name` varchar(3));create table tab22 (id int,`name` varchar(3));insert into tab11 values(1,'tt1'),(2,'tt2'),(4,'tt4');insert into tab22 values(3,'tt3'),(5,'t...

2010-11-02 17:23:25 59

原创 iphone开发

http://cocoachina.com/ 大量iPhone开发资料,教学,经验,还有自曝。 http://www.iteye.com/forums/board/mobile iPhone开发论坛,人气鼎盛,大量自曝,还有Android的讨论 http://developer.apple.com/iphone/ 苹果iPhone开发官方主页,提供大量实例、文档和教学视频 http://www.s...

2010-10-26 15:51:40 81

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除