- 博客(6)
- 收藏
- 关注
原创 Nosql数据库的查询那些事
Nosql的查询目前主要包括范围查询和前缀匹配的模糊查询。范围查询涉及的原理主要有分布式B+树算法。前缀模糊查询的算法实现则为分布式Trie来散列前缀。对于多项条件的and匹配查询则是利用布隆过滤器的方式来实现的。先做一个简单的介绍在这里了,后续我再把我的理解整理出来。
2010-05-30 12:54:00 2991 2
原创 我的梦想在何处落地?
这个周末快要结束了,而我却是大有感慨,大有不写点什么实在是心里憋得慌,所以大老远的火急从位于保淑北路文二路口的浙江省新华书店那骑自行车赶回文一西路益乐新村的蜗居,开始写这边心得了。这次的心路历程不得不从这个周末的两天所发生的事来说起了。。。。。。这个周六我卧在家看了一天新出版的《hadoop权威指南》,貌似很有心得,毕竟首次拿到Hadoop的中文版的书,比在网上搜集的林林翠翠的资料看起来要
2010-05-23 15:58:00 1600 3
原创 对Hadoop中一段将字节码数组转换为Integer的代码的思考
在Hadoop的类org.apache.hadoop.io.WritableComparator中有如下一段代码,完成将Integer值序列化后对应的字节码数组重新反序列化为Integer的功能。 /** Parse an integer from a byte array. */ public static int readInt(byte[] bytes, int start) {
2010-05-23 12:13:00 2230 1
原创 利用JavaAPI访问HDFS的文件
1、重读配置文件core-site.xml要利用Java客户端来存取HDFS上的文件,不得不说的是配置文件hadoop-0.20.2/conf/core-site.xml了,最初我就是在这里吃了大亏,所以我死活连不上HDFS,文件无法创建、读取。hadoop.tmp.dir>/home/zhangzk/hadoopA base for other temporary directori
2010-05-16 14:34:00 46432 14
转载 How To Write Map-Reduce OnHadoop
概述Hadoop Map-Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。一个Map-Reduce 作业(job) 通常会把输入的数据集切分为若干独立的数据块,由 map任务(task)以完全并行的方式处理它们。框架会对map的输出先进行排序,然后把结果输入给reduce任务。通常作业的
2010-05-09 21:55:00 2695 1
原创 SVN分支与合并
合并合并包含两点,首先两个版本库树比较,然后将区别应用到本地拷贝。 这个命令包括三个参数: 初始的版本树(通常叫做比较的左边), 最终的版本树(通常叫做比较的右边), 一个接收区别的目标拷贝(通常叫做合并的目标)。 一旦这三个参数指定以后,两个目录树将要做比较,比较结果将会作为本地修改应用到目标工作拷贝,当命令结束后,结果同你手工修改或者是使用svn add或svn delete没有什么区别,
2010-05-03 22:53:00 857 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人