自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (1)
  • 收藏
  • 关注

经纬度搜索(1)-Geohash算法原理

geohash作为Solr的位置信息搜索算法,有必要了解其基本的实现原理。geohash算法的wiki链接为[url]http://en.wikipedia.org/wiki/Geohash[/url],这里再结合自己的理解,重新复述一下。[b]由经纬度变成base32标识[/b]geohash的思想,是将所有的经纬度坐标,通过geohash,变成一个唯一的base32标识。他将世界上...

2012-01-13 17:10:20 480

Solr 4.0 : Realtime Get

原文链接:[url=http://java.dzone.com/articles/solr-40-realtime-get]Solr 4.0: Realtime GET[/url]在即将到来的Solr 4.0中,"Realtime get"是我准备要研究的。它甚至允许你查看发送到Solr但还没被commit到索引文件的数据。下面让我们看一下它是如何运作的。[size=large][...

2012-01-12 20:23:28 120

Lucene & Solr Year 2011 in Review

原文链接:[url=http://java.dzone.com/articles/lucene-solr-year-2011-review?mz=33057-solr_lucene]Lucene & Solr Year 2011 in Review[/url]2011就要过去了,是时候回顾一下过去的12个月里做过的事了。让我们简要回顾一下这12个月以来,lucene/solr 业内的一些重...

2012-01-11 16:42:43 119

原创 Solr的自动完成/自动补充实现介绍(第三部分)

原文URL:[u]http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene[/u]在之前的两个部分([url=http://hankesi2000.iteye.com/admin/blogs/1134395]part1[/url]、[url=http://hankesi2000.iteye.co...

2011-10-25 20:59:09 122

Solr的自动完成/自动补充实现介绍(第二部分)

原文链接:[url="http://css.dzone.com/news/solr-and-autocomplete-part-2?mz=33057-solr_lucene"]Solr and Autocomplete (part 2)[/url]在[url="http://hankesi2000.iteye.com/admin/blogs/1134395"]Solr的自动完成/自动补充实...

2011-09-14 11:06:36 91

影响solr性能的一些因素(附使用经验)

原文:[url=http://www.lucidimagination.com/search/out?u=http%3A%2F%2Fwiki.apache.org%2Fsolr%2FSolrPerformanceFactors]SolrPerformanceFactors[/url]Solr本身的性能不错,但是在使用过程中,还是会遇到一些使用错误,或是没考虑到的地方;在出现瓶颈时,可以首先...

2011-08-19 11:55:52 455

Solr的自动完成/自动补充实现介绍(第一部分)

原文:http://java.dzone.com/news/solr-and-autocomplete-part-1大部分人已经见过自动完成(autocomplete)的功能了(见下图),solr提供了构建这个功能的机制。今天,我将给你展示如何使用facet的方式来添加自动完成机制。[img]http://dl.iteye.com/upload/attachment/525778/...

2011-08-01 21:52:33 109

lucene/solr中查询结果的分组/字段的压缩

原文链接:[url]http://blog.jteam.nl/2011/05/19/search-result-grouping-field-collapsing-in-lucene-solr/#more-3424[/url]在搜索的项目中,我们经常有对搜索结果进行分组或对字段进行压缩的需求。[url=http://blog.jteam.nl/2009/10/20/result-group...

2011-06-28 14:49:31 200

Solr、lucene查询语句作或查询时的注意点

在使用lucene做搜索引擎时,中文的查询是值得注意的一点。其中有一些问题需要尤其注意:首先推荐在lucene方面的牛人的博客:http://forfuture1978.iteye.com/blog/588716,这里有关于查询的一些疑惑,在此不再做介绍。另:他的其他关于lucene的文章,也强烈推荐。在查询方面,与的查询,基本不会有太大问题,中文分词工具分好词后,所有的term都...

2011-06-14 15:56:46 112

SOLR优化-filter cache

原文链接:[url]http://java.dzone.com/news/merge-policy-internals-solr?mz=33057-solr_lucene[/url]今天我们关注一个solr的cache类型:filter cache。接下来,我会解释它是什么、怎么配置它以及如何更好的使用它。What it is used for?先从内部机制开始。FilterC...

2011-06-13 11:52:59 354

lucene内部的合并策略

原文链接:[url]http://java.dzone.com/news/merge-policy-internals-solr?mz=33057-solr_lucene[/url]solr(or lucene)内部的合并策略是怎样的呢?选择哪些段(segment)需要被合并,是基于名为[color=gray]MergePolicy[/color]的抽象类决定的。这个类创建了一个合并规...

2011-05-24 22:22:43 225

lucene索引的新设计:DWPT,充分利用系统资源

翻译原文:[url]http://blog.jteam.nl/2011/04/01/gimme-all-resources-you-have-i-can-use-them/[/url]注:本文属个人爱好和英语学习,很多地方翻译的不好,如果需要了解真实内容,请阅读原文。ps:lucene4.0的并发索引号称提高了265%的写速度,对系统资源的利用也很充分,下面这篇文章主要讲并发写的一个实...

2011-05-16 15:27:07 548

原创 hadoop在windows上启动遇到的一些问题

这里说的是hadoop-0.21.0的安装在windows上使用cygwin启动hadoop,首先参考:[url]http://pages.cs.brandeis.edu/~cs147a/lab/hadoop-windows/[/url]之后启动会报出[code="java"]Exception in thread "main" java.lang.NoClassDefFo...

2010-12-29 22:17:55 163

原创 我对android的第一印象

今天安装上了Android的SDK,在官方上的eclipseURL连接失败,于是改用自己原有的eclipse,并安装插件;正好看到Android Development with Eclipse教程,果断helloworld了一把。首先上我参考的教程:[url]http://www.vogella.de/articles/Android/article.html#installation_...

2010-12-18 22:11:39 89

原创 习惯决定命运

最近很久没写博客了,不过一些技术网站还是坚持在看。想来是新换了个公司,想以公司的业务熟悉为主;目前发现其实很多时候自己的心还是在技术上的。毕竟习惯不容易改变,如果一段时间内只看业务,也许会将学技术、写技术的习惯遗忘!是时候继续写博客了。我没有完成的python,还有最近在看的hadoop。我还是想把自己的学习心得写下来,督促自己、巩固知识。分享就算了,写的太烂了。。。...

2010-10-31 16:11:44 108

原创 因换了新的公司,博客暂时更新慢了

刚开始学习的python,恐怕要搁置一下了。一切以学习新业务为主,额外的时间,用来学习第一语言java在项目中的一些技术,弥补一下不足。不过python,我很看好你,有时间还会学的。...

2010-09-28 20:30:38 87

原创 我对于公司“始业教育”的感触

对于新公司,越来越有回家的感觉了。在“始业教育”中,我更多的体会到了公司的文化,看到了公司中跟我同龄的年轻人,他们身上所发出的光芒。这对于我,何尝不是一种鼓励!在“始业教育”的环节,受教育的同学变的很开放心胸;将自己内心真实的一面展示给了大家。这一点难能可贵,在这里,你不用刻意去装,也不用觉得不好意思,大家都开诚布公了,我有什么好藏着的呢?前来给学生培训的讲师,都是公司里的...

2010-09-19 21:10:33 309

原创 转帖&有感:Digg在挣扎,技术副总裁已卷铺盖走人

原文链接:[url]http://www.dbthink.com/?p=639[/url]放在这里,是在提醒自己:又一个使用cassandra的项目倒下了。。。我之前研究、测试canssandra时候出现的问题,到现在还历历在目。性能、容量、最终一致性等等的问题都遇到过一些;来到新的公司里也看到了一些使用中的不如意。如今又来了一起,对于我,有些安慰,又有些失落。究竟cass...

2010-09-19 20:53:04 105

原创 离职感言

最近半年一直有时间,让我可以写写博客,看看书,玩玩游戏。。。也让我有时间思考下一步的路,究竟该如何发展?我在1年前就已经学会的技术,做了几个项目之后,用的还是一样的东西。我没有放弃继续学习的好习惯,但总感觉这习惯在慢慢被吞噬!没有应用场景,没有现场交流空间,我是在我的道路上进行一个人的战争。这样的技术自然是皮毛,我自认为只有实际的业务驱动,才会让所学技术有很好的深入、突破。...

2010-08-12 09:14:11 104

Cassandra中rowcached对性能的影响

一直对cassandra做测试,但是测试的结果却跟官方提供的写快,读慢的情况相反。一直没找到问题的答案。最近在做大数据量的测试时才想起了conf/storage-conf.xml中的这个字段rowcached:[code="shell"] ~ The optional RowsCached attribute specifies the number of rows...

2010-07-08 10:19:29 284

原创 Bigtable:一个分布式的结构化数据存储系统[中文版]---转载

Bigtable:一个分布式的结构化数据存储系统译者:alex摘要Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很多项目使用Bigtable存储数据,包括Web索引、Google Earth、Google Finance。这些应用对Bigtable提出的要求差异非常大,无论是在数据量上(从URL到...

2010-06-28 09:41:28 396

原创 Top 10 Performance Problems taken from Zappos, Monster, Thomson and Co

此为转帖:http://www.theserverside.com/news/thread.tss?thread_id=60382一些被大家公认的性能问题,很值得在构建系统和开发时多多考虑:#1: Too Many Database Calls,#2: Synchronized to Death,#3: Too chatty on the remoting channels...

2010-06-17 09:26:53 78

python学习笔记二:介绍python对象类型

Python的核心数据类型大概有(太懒就不打了 :D ):[img]http://dl.iteye.com/upload/attachment/257853/014c9233-a556-3509-b880-9730198cd38f.bmp[/img]Python的世界里也是万事皆对象的概念,不过要比JAVA做的充分一些,比如没有了基本类型。不过对于以上不同的类型,在你创建完后,她就会和...

2010-06-07 23:27:59 90

Tokyo Cabinet & Tyrant 多服务器节点master-master部署思考

Tokyo Cabinet & Tyrant支持master-slaver和master-master两种分布式方式的部署,但是由于master-slaver在master宕机后需要重新手动设置master,这种冷启动的方式不是特别好;而且master-slaver的方式基本上是用来处理多读少写的操作,对于读写比例不大的我们的项目,感觉更适合使用master-master的方式。假设有两台...

2010-06-02 11:57:43 122

python学习笔记一:使用入门

开始学习Python,并准备以《Pyrhon学习手册(第3版)》作为参考书。毕竟是第2语言,为了怕以后忘记,在这里写下学习时的心得,并与我的第一语言JAVA做比较,看他俩都有哪些不同,也可以从中比较两者的优缺点。文中只写我感兴趣的内容,而不是所有的信息。如果有错误,还望偶尔看到这篇文章并发现错误的你,指点一下 :D 第一部分当然是是用入门了,文中重点提到的主要优点感觉是开发...

2010-05-31 22:45:00 115

开始学习我的第二语言

学习第二门开发语言的想法,在08年初就有了。当时周围很流行ruby,javaeye后来也将站点由java改为了ROR。我也买了一本ruby的镐头书。说来惭愧,当时的技术能力太薄弱,第一语言都没学好,哪有心情去整第二语言啊。。。经过了一年多的努力,我的JAVA水平终于有了一些长进。感觉可以学习第二门开发语言了,哈哈。根据自己的方向:偏向后台技术,在分布式处理上更爱好一些;再加...

2010-05-27 12:48:47 119

原创 Redis的java客户端JRedis1.0RC退出时的bug

刚刚又回答了一次javaeye的发帖规则提问,不知道现在发的这个帖子有没有人发布过,呵呵。。。Redis的java版客户端有两个:JDBC-Redis 和 JRedis,听了好多评论说JDBC-Redis的性能并不怎么样,so直接使用JRedis。在测试并发的时候,为了模拟项目实际的场景,所以每次的增读都调用一次JRedisClient的ping即建立连接操作(当然可以将客户端维护...

2010-05-18 09:04:56 68

Cassandra分布式节点服务器的简单部署

Cassandra作为目前很热门的一个NOSQL型数据库,引起了很多的关注。对NOSQL感兴趣的我,也来作了一次简单的测试。废话不多说,下面就来介绍下Cassandra多节点的部署。部署要求:1. JDK1.62. OS:linux,我在windows上实验过,不知道为啥一直没通(7000端口上只有windows的发包,双方不互相通信)3. cassandra 0.6...

2010-05-01 16:56:06 378

分布式数据库总结

最近流行的NoSQL的数据库挺流行的,之前也对这些DBorCache进行了研究,在这里总结一下,留作备份。Apache Cassandrahttp://incubator.apache.org/cassandra/Cassandra的使用者现在包括了Rackspace、Digg、Facebook、Twitter、Cisco、Mahalo、Ooyala等等。Tokyo Cab...

2010-03-16 17:15:00 92

IO的类型如果这样分,JAVA的NIO属于哪个?

最近看dennis_zane的关于AIO的帖子,查了查相关IO的类型,没有找到很好的资料,感觉IBM里的一个帖子说的挺具体,URL为:[url]http://www.ibm.com/developerworks/linux/library/l-async/[/url]里面将IO的模型分为四种为:同步的IO、同步的NIO、异步的IO、异步的NIO:[img]http://www.ibm.co...

2010-02-05 10:49:27 123

ITerm2 Mac上最好用的远程登录工具,比crt 还好用

ITerm2 Mac上最好用的远程登录工具,比crt 还好用

2013-12-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除