开源项目
sunqp0208
脚踏实地
展开
-
solr配置停止词,同义词和扩展词库
停止词:lucene的停止词是无功能意义的词,比如is 、a 、are 、”的”,“得”,“我” 等,这些词会在句子中多次出现却无意义,所以在分词的时候需要把这些词过滤掉。扩展词库:就是不想让哪些词被分开,让他们分成一个词。同义词:假设有一个电子商务系统,销售书籍,提供了一个搜索引擎,一天,市场部的人要求客户在搜索书籍时,同义词就是比如输入“电子”,除了展示电子相关的书籍,还需要展转载 2013-11-20 15:49:29 · 1650 阅读 · 0 评论 -
MongoDB与内存
但凡初次接触MongoDB的人,无不惊讶于它对内存的贪得无厌,至于个中缘由,我先讲讲Linux是如何管理内存的,再说说MongoDB是如何使用内存的,答案自然就清楚了。据说带着问题学习更有效,那就先看一个MongoDB服务器的top命令结果:转载 2014-11-15 09:26:30 · 607 阅读 · 0 评论 -
monodbvue使用
对于数据库来说有一款功能强大的管理工具将会大大的提高我们的工作效率。对于MongoDB来说MongoVUE就是这样一款工具,MongoVUE在1.0版以后就开始收费了,所以我现在用的还是0.9.7.2版。对于初学来时已经够用了。安装运行后的界面如下:点击Connect来连接MongoDB数据库填写好Name 和Server后点击Save,Name随便给取个名字就型,Server原创 2014-10-29 21:56:33 · 641 阅读 · 0 评论 -
mongodb 常用API
MongoDB常用API总结Ø 类转换 当把一个类对象存到mongoDB后,从mongoDB取出来时使用setObjectClass()将其转换回原来的类。 public class Tweet implements DBObject { /* ... */ } Tweet myTweet = new Tweet(); myTweet.put("user",原创 2014-10-30 19:54:14 · 1222 阅读 · 0 评论 -
mongodb 批量查询 输出指定字段
本文介绍的是mongodb 批量查询指定输出字段/** * * @param key * 请求字段 * @param value * 请求rid的数组 * @param num * 测试输出字段数量 * @return */ public int queryMuchWithField(St原创 2014-11-24 11:27:58 · 6871 阅读 · 0 评论 -
mongodb 批量查询
使用mongodb语法QueryOperators.IN进行查询,导出字段为全部原创 2014-11-24 11:16:23 · 7737 阅读 · 0 评论 -
Nginx编译部署环境安装
nginx可以使用各平台的默认包来安装,本文是介绍使用源码编译安装,包括具体的编译参数信息。正式开始前,编译环境gcc g++ 开发库之类的需要提前装好,这里默认你已经装好。ububtu平台编译环境可以使用以下指令apt-get install build-essentialapt-get install libtoolcentos平台编译环境使用如下指令安装m原创 2015-01-06 16:59:13 · 852 阅读 · 0 评论 -
mongodb 集群搭建
一 硬件配置采用高配置的服务器用ESXI进行虚拟化出来11台相同测试服务器,每台具体配置为:磁盘:500Gcpu核数:16核内存:64G二 下载mongodb,此处可以到官网下载,由于文件太大,就不上传了,我下载的是mongodb-linux-x86_64-2.4.12.tgz,原因是该版本比较稳定。三 安装图解四 安装具体步骤配置服务器路由服务器原创 2015-01-05 16:34:19 · 946 阅读 · 0 评论 -
Spring Mongodb
安装Spring for Mongodb Spring项目为方便对Mongodb的操作,建立了spring-data的子项目,地址在: http://www.springsource.org/spring-data/mongodb,目前版本是1.0.0M2阶段,已支持对Mongodb的一系列基本操作。我们先从http://www.springsource.org/spring-翻译 2015-01-12 10:45:19 · 1013 阅读 · 0 评论 -
mongo update 使用
修改mongo文档记录时,使用的赋值表达式$set 修改某列的值$unset 删除某个列 (赋值1)$rename 重命名某个列$inc 增长某个列如:1.1、新增一条记录db.student.insert({name:'zhangsan',rich:true,sex:'m',age:10})1.2、修改该记录db.student.update({name:'zha原创 2015-02-03 13:46:17 · 3661 阅读 · 0 评论 -
mongo $where 使用注意性能问题
mongodb在使用$where表达式的时候要注意,他的优缺点非常明显,具体使用请慎重,根据实际需求来决定是否有必要。1、$where操作的原理:当由where操作时,他将逐一遍历mongo集合中文档对象,将其属性由Bson格式转换为Json。然后能通过json找到对象属性,供js来调用。而如果不用where语句进行比较,则是通过文档对象的Bson二进制形式直接进行比较,类似于关系型数原创 2015-02-09 11:12:50 · 2311 阅读 · 0 评论 -
分面(Faceting)
分面就是将搜索结果基于索引中的terms按类整理.搜索结果带有索引的term,没有term都带有该term匹配的文档数.分面使用户更容易探究搜索结果,缩小查询结果范围以达到更精确的搜索. 1.1 General Parameters 这里介绍了控制分面的基本参数: facet:设置为true,开启分面功能.如果设置为false,或者为空,或者缺失,关闭分面功能.默认转载 2015-04-08 11:09:25 · 3103 阅读 · 1 评论 -
mongodb 启动命令参数说明
基本配置----------------------------------------------------------------------------------quiet# 安静输出--port arg# 指定服务端口号,默认端口27017--bind_ip arg# 绑定服务IP,若绑翻译 2014-10-29 08:57:56 · 644 阅读 · 0 评论 -
阿里巴巴数据源
一个非常好用,且稳定的数据源驱动,原创 2014-10-23 16:09:33 · 749 阅读 · 0 评论 -
ssh2做的一个简单框架
采用目前最新的struts-2.3.1.2、hibernate3.6.10.Final、spring-framework-3.1.1.RELEASE开发包,以及eclipse-jee-indigo-SR2-win32、apache-tomcat-7.0.27服务器、JDK6和mysql5做开发环境,参考了前辈的一篇相关文章,改正了其中的错误和疏漏,克服了公司分配的“新”机器每小时自动重启三次的困难转载 2013-08-01 15:36:01 · 810 阅读 · 0 评论 -
nutch使用攻略bate版
1.使用远程工具连接ubuntu系统2.svn下载nutch,但需要下载svn工具,下载方法apt-get install subversion,然后需要下载nutch代码svn co https://svn.apache.org/repos/asf/nutch/tags/release-1.7/3.使用ant进行编译,输入ant就行4.进入ant编译后的生成一个runtime文件夹下原创 2013-11-20 14:36:03 · 875 阅读 · 0 评论 -
ubuntu12.04下安装zookeeper3.4.5集群环境
1.下载zookeeper-3.4.5或者wget http://mirrors.cnnic.cn/apache/zookeeper/zookeeper-3.4.5/zookeeper-3.4.5.tar.gz2.由于是需要用到集群,先在host中注入vi /etc/hosts加上192.168.50.130 sun192.168.50.131 sun1192.168.50.1原创 2013-12-06 17:04:40 · 1243 阅读 · 0 评论 -
solr报index locked for write for 的错误及解决办法
很多情况自己不小心重启电脑而此时solr正在索引时,将可能启动报错LockObtainFailedExceptionindex locked for write for core。到data/index下面看应该是有一个write.lock文件,删掉就行了。可能报文件找不到的错,就到example/solr/collection1/conf下面拷贝过来就行了。转载 2014-03-12 13:15:22 · 9067 阅读 · 0 评论 -
solr 排序限制
根据Solr源码发现,solr对排序段Field是有要求的,主要有两点:1 field必须是索引的field。2 field不能是multivalued 多个值的。代码如下:Solr在获取排序field时,会调用SchemaField的这个方法:public void checkSortability() throws SolrException { if转载 2014-04-28 14:37:51 · 1437 阅读 · 0 评论 -
solr 查询参数说明
q - 查询字符串,必须的。fl - 指定返回那些字段内容,用逗号或空格分隔多个。start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows - 指定返回结果最多有多少条记录,配合start来实现分页。sort - 排序,格式:sort=+[,+]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,原创 2014-04-28 14:41:53 · 798 阅读 · 0 评论 -
lucene 高级语法详解
Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器。本文章详细的介绍了Lucene的查询语法。通过Java语法分析器把一个查询字符串解析成 Lucene的查询器。在你选择使用Query Parser前,请考虑以下事项:如果你打算在程序中拼接查询语法串然后再利用Query Parser转换,那么强烈建议转载 2014-04-28 14:49:10 · 1498 阅读 · 0 评论 -
solr 忽略大小写
solr忽略大小写配置,在schema.xml中,对filterclass="solr.SynonymFilterFactory"synonyms="synonyms.txt"ignoreCase="true"expand="true"/>中,对ignoreCase进行配置,如果为true,表示转化为小写匹配,及忽略大小写原创 2014-05-21 09:39:20 · 3431 阅读 · 1 评论 -
使用mybatis generator自动生成代码步骤
1、在项目中创建一个generatorConfig.xml,样例稍后传 其中注意事项:原创 2014-08-12 16:18:33 · 1332 阅读 · 0 评论 -
hadoop 2.2搭建
由于hadoop2.2.0是32位的,需要编译成64位的,现以做好编译成功的rar文件http://download.csdn.net/detail/u011053107/7242945http://download.csdn.net/detail/u011053107/7242935另外提供32位hadoop下载地址wget http://mirrors.hust.edu.cn/ap原创 2014-08-26 17:45:26 · 501 阅读 · 0 评论 -
kafka的producer报错异常
kafka的producer出现异常,现象如下 Exception in thread “Thread-0” kafka.common.FailedToSendMessageException: Failed to send messages after 3 tries. at kafka.producer.async.DefaultEventHandler.handle(Default原创 2016-07-04 15:51:25 · 7346 阅读 · 0 评论