![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hadoop
文章平均质量分 78
草藤木屋
The most beautiful thing in the world is that you make you plan and make it true by one one.
展开
-
Hadoop搭建
CentOS 5.5 安装hadoop-0.21.0 2010-12-24 11:05 2656人阅读 评论(1) 收藏 举报 centoshadoopjavasshpathjdk倒腾了一天,终于在CentOS上装上了hadoop-0.21.0,特此记录,以备后用。操作系统:CentOS 5.5Hadoop:hadoop-0.21.0JDK:1.6.0_17转载 2013-10-20 11:04:35 · 571 阅读 · 0 评论 -
Cascading TemplateTap的使用
Cascading TemplateTap使用实例原创 2014-04-09 11:01:04 · 752 阅读 · 0 评论 -
Hadoop 2.0 Queue
Hadoop 2.0 Queue setting 解析原创 2014-05-13 10:08:55 · 3166 阅读 · 1 评论 -
Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究
由于本文比较长,考虑到篇幅问题,所以将本文拆分为二,请阅读本文之前先阅读本文的第一部分《Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)》。为你带来的不变,敬请谅解。 与MultipleOutputFormat类不一样的是,MultipleOutputs可以为不同的输出产生不同类型,到这里所说的MultipleOutputs类还是旧版转载 2014-06-06 15:37:45 · 818 阅读 · 0 评论 -
Hadoop Yarn 安装
为了构建基于Yarn体系的Spark集群,先要安装Hadoop集群,为了以后查阅方便记录了我本次安装的具体步骤。原创 2014-06-30 16:48:06 · 4703 阅读 · 1 评论 -
Hadoop Map/Reduce 原理
Hadoop是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员。HDFS是Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB 级)的大文件(通常超过64M),其原理如下图所示:原创 2014-09-24 14:18:52 · 1047 阅读 · 0 评论