自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

hadoop博客资源

邵铮的PPT,关于hive的架构/原理/优化,研究hive不可不看[url]http://www.slideshare.net/zshao[/url]更多的hive presentation ppt [url]http://wiki.apache.org/hadoop/Hive/Presentations[/url]hadoop 源代码分析最好最全的[url]http:...

2010-07-21 21:26:47 182

什么是MapReduce?

[b][size=medium]1、MapReduce来龙去脉[/size][/b]MapReduce是一个说难懂也难懂、说好懂也好懂的概念。说它难懂,是因为,如果你只理论上的去学习、去理解,确实很难懂。说它好懂,是因为,如果你亲手在hadoop运行过几个MapReduce的job,并稍微学点hadoop的工作原理,基本上也就理解MapReduce的概念了。所以,有句话说的...

2010-07-12 22:15:11 263

用hadoop估算圆周率PI(3.1415926)的值

[b][size=medium]一、hadoop不适合计算密集型的工作[/size][/b]以前看过一个PPT: [url=http://www.tomwheeler.com/publications/2009/lambda_lounge_hadoop_200910/twheeler-hadoop-20091001-handouts.pdf]Hadoop In 45 Minutes or ...

2010-07-12 16:42:10 859

hadoop的心跳回忆

hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,而datanode/tasktracker属于slaves。master只有一个,而slaves有多个。namenode与datanode之间的通信,jobtracker与tasktracker直接的通信,都是通过“心跳”完成的。以前看过hadoop心跳原理的源代码,今天再...

2010-07-11 09:38:33 202

hadoop的1TB排序

[b][size=medium]1、1TB(或1分钟)排序的冠军[/size][/b]作为分布式数据处理的框架,集群的数据处理能力究竟有多快?或许1TB排序可以作为衡量的标准之一。1TB排序,就是对1TB(1024GB,大约100亿行数据)的数据进行排序。2008年,[url=http://beijing-josh.iteye.com/blog/212296]Hadoop赢得1TB排序...

2010-07-11 08:17:02 249

map的环形内存缓冲区

hadoop在执行MapReduce任务时,在map阶段,map函数产生的输出,并不是直接写入磁盘的。为了提高效率,它将输出结果先写入到内存中(即环形内存缓冲区,默认大小100M),再从缓冲区(溢)写入磁盘。下面我们就来看看这段代码。[size=medium][b]1、找到环形内存缓冲区[/b][/size]在运行job时,有条输出:09/04/07 12:34:35 ...

2010-07-11 01:17:15 883

hadoop扫盲篇

[b]一、Hadoop是什么?[/b]答:是google的核心算法MapReduce的一个开源实现。用于海量数据的并行处理。hadoop的核心主要包含:HDFS和MapReduce HDFS是分布式文件系统,用于分布式存储海量数据。 MapReduce是分布式数据处理模型,本质是并行处理。[b]二、多少数据算海量数据?[/b]答:个人...

2010-07-10 23:51:17 169

说说hadoop的DFSOutputStream

当我们用命令:[code="java"]hadoop fs -copyFromLocal localfile hdfs://...[/code]将本地文件复制到HDFS时,其背后的复制过程是怎样的?本地文件通过什么方式传输到datanode上的呢?这里面很显然的是:1、文件在多个电脑之间进行了传输(至少有2台电脑:本地电脑和一个datanode节点)。2、如果文件超过一...

2010-07-10 23:09:50 195

原创 hadoop资源汇总(持续更新中...)

1、Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看[url]http://cloud21.iteye.com/blog/607175[/url]2、关于Hadoop的两本书 -- 有电子书下载[url]http://caibinbupt.iteye.com/blog/418846[/url]3、JavaEye Hadoop圈子 -- 圈子中的[url=ht...

2010-07-10 17:41:23 171

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除