Hadoop
文章平均质量分 79
风雪满江山
软件研发改进实践者
展开
-
在centos虚拟机中安装hadoop(伪分布式模式)
原文来自 http://zhans52.iteye.com/blog/1102649,忘情游天下的CentOS 安装 hadoop(伪分布模式)。我的第一个hadoop测试环境,就是参考这篇文档搭建的。在搭建过程中,对原文一些SSH设置不太详细的地方做一些补充。感谢忘情游天下提供的好文章。 我装的CentOS 6 虚拟机, 软件准备:jdk 1.6 U29转载 2011-12-07 10:23:08 · 2376 阅读 · 1 评论 -
Hadoop的MapReduce实现原理解释
1. 如何用通俗的方法解释MapReduceMapReduce是Google开源的三大技术之一,是对海量数据进行“分而治之”计算框架。为了简单的理解并讲述给客户理解。我们举下面的例子来说明.首先,面对一堆杂乱的东西,有若干个汉堡、若干个冰淇淋、若干个可乐。如果级别都是上万数量的情况下,有没有方法把他们较快的分析出来?第一步,调度员简单的将这一堆东西分解成若干堆。原创 2012-02-14 17:00:26 · 2357 阅读 · 0 评论 -
伪分布式环境下,Hive0.8.1与HBase0.92.0集成的配置说明
参见:"Hive0.8.1版本与HBase0.94.0集成的安装说明.doc" http://vdisk.weibo.com/s/31R7f1 环境需求1.1 Linux:推荐centos64位系统,当前最新版本是6.0。官方网站:www.centos.org1.2 JDK:至少jdk6,推荐使用sunJDK最新jdk6版本。原创 2012-03-08 10:17:47 · 2542 阅读 · 0 评论