hadoop
goodhappy8
这个作者很懒,什么都没留下…
展开
-
Partitioner, SortComparator and GroupingComparator in Hadoop
来源:http://roserouge.iteye.com/blog/746391 hadoop 0.20.2 api里面,作业被重新定义到了类 org.apache.hadoop.mapreduce.Job。 它有3个特别的方法: job.setPartitionerClass(Partitioner p); job.setSortComparatorClass(RawCompa...2012-06-20 10:07:00 · 63 阅读 · 0 评论 -
深入理解Bloom Filter
文章转自:http://blog.csdn.net/liuben/article/details/6602683 Bloom Filter是1970年由Bloom提出的,最初广泛用于拼写检查和数据库系统中。近年来,随着计算机和互联网技术的发展,数据集的不断扩张使得 Bloom filter获得了新生,各种新的应用和变种不断涌现。Bloom filter是一个空间效率很高的数据结构,...2012-12-05 16:01:00 · 98 阅读 · 0 评论 -
(转)HBase技术介绍
来源:http://www.searchtb.com/2011/01/understanding-hbase.html HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现...2012-07-27 10:19:00 · 69 阅读 · 0 评论 -
(转)HBase 官方文档__中文版
来源:http://www.yankay.com/wp-content/hbase/book.html HBase官方文档 Copyright © 2010 Apache Software Foundation,盛大游戏-数据仓库团队-颜开(译) Revision History Revision 0.90.4 配置,数据模型使用入门 ...2012-07-27 09:36:00 · 155 阅读 · 0 评论 -
ZooKeeper Installation
来源:https://ccp.cloudera.com/display/CDHDOC/ZooKeeper+Installation#ZooKeeperInstallation-InstallingtheZooKeeperServerPackage Contents Upgrading ZooKeeper to the Latest CDH3 Release Perfo...2012-07-26 17:36:00 · 124 阅读 · 0 评论 -
(转)HBase Installation
来源:https://ccp.cloudera.com/display/CDHDOC/HBase+Installation Contents Upgrading HBase to the Latest CDH3 Release Step 1: Perform a Graceful Cluster Shutdown Step 2. Stop the ZooKeeper...2012-07-25 14:51:00 · 103 阅读 · 0 评论 -
CDH3 Installation Guide
来源:https://ccp.cloudera.com/display/CDHDOC/CDH3+Installation+Guide About this Guide ThisCDH3 Installation Guideis for Apache Hadoop developers and system administrators interested in Ha...2012-07-25 10:55:00 · 77 阅读 · 0 评论 -
(转)Zookeeper全解析——Paxos作为灵魂
来源:http://www.spnguru.com/2010/08/zookeeper%E5%85%A8%E8%A7%A3%E6%9E%90%E2%80%94%E2%80%94paxos%E7%9A%84%E7%81%B5%E9%AD%82/ Zookeeper全解析——Paxos作为灵魂 原计划在介绍完ZK Client之后就着手ZK Server的介绍,但是发现ZK Serve...2012-07-24 17:06:00 · 67 阅读 · 0 评论 -
(转)HBase技术介绍
来源:http://www.searchtb.com/2011/01/understanding-hbase.html HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现,类似...2012-07-24 10:08:00 · 57 阅读 · 0 评论 -
(转)十道海量数据处理面试题与十个方法大总结
海量数据处理:十道面试题与十个海量数据处理方法总结 作者:July、youwang、yanxionglu。 时间:二零一一年三月二十六日 本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。 出处:http://blog.csdn.net/v_JULY_v。 ------------------------------------------ ...2012-07-08 22:52:00 · 51 阅读 · 0 评论 -
Using Hadoop Distributed Cache
来源:http://www.ashishpaliwal.com/blog/2012/04/using-hadoop-distributed-cache/ Hadoop has a distributed cache mechanism to make available file locally that may be needed by Map/Reduce jobs. This...2012-06-20 10:33:00 · 73 阅读 · 0 评论 -
bloom filter的开源实现程序memcached bloom filter
文章转自:http://www.heyues.com/mc_bloom_filter/ google code 上的介绍 Introduction Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,被广泛使用于各种海量数据排重的场景中。Mc bloom ...2012-12-05 16:12:00 · 137 阅读 · 0 评论