Hadoop
Thomas-yang
这个作者很懒,什么都没留下…
展开
-
Hadoop简介
Hadoop起源于2002年的Apache Nutch项目,是Apache Lucene的子项目之一。2004年,Google在OSDI上公开发表了题为《MapReduce: Simplified Data Processing on Large Clusters》的论文,受到启发的Doug Cutting等人开始实现MapReduce计算框架并与NDFS(Nutch Distributed Fi原创 2013-10-26 00:32:37 · 900 阅读 · 0 评论 -
CentOS下Hadoop伪分布模式安装笔记
CentOS下Hadoop伪分布模式安装笔记 一. 前言 Hadoop 伪分布式模式是在单机上模拟 Hadoop分布式,单机上的分布式并不是真正的伪分布式,而是使用线程模拟分布式。Hadoop本身是无法区分伪分布式和分布式的,两种配置也很相似,唯一不同的地方是伪分布式是在单机器上配置,数据节点和名字节点均是一个机器。 现在很多初学者根本不具备搭建完全分布式集群的硬件转载 2014-10-31 11:27:21 · 1099 阅读 · 0 评论 -
经典Hadoop家族系列文章
经典Hadoop家族系列文章 一 学习路线图 Hadoop家族学习路线图 开篇必读 Hive学习路线图 学习hadoop到上手工作线路指导(中级篇) 零基础学习hadoop到上手工作线路指导(编程篇) Mahout学习路线图 二 编程实践 Hadoop历史版本安装 用Maven构建Hadoop项目 Hadoop编程调用HDFS 在Ubuntu中安装HBase转载 2014-10-31 13:26:34 · 1260 阅读 · 0 评论