3、MapReduce机制

MapReduce是Hadoop重要组成部分,主要包含map、shuffle和reduce过程。

1)  在集群中任意主机运行job程序;

2)  向jobtracker申请jobID

3)  通过HDFS散发文件,拷贝

4)  提交作业

5)  Jobtracker初始化工作

6)  Jobtracker向HDFS中的namenode询问文件信息

7)  Tasktracker与jobtracker心跳机制,确定taskTracker

8)  Tasktracker向HDFS申请文件

9)  taskTracker开始假设jvm,运行job


阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/petersmart123/article/details/49964491
个人分类: Hadoop
上一篇2、初识HDFS
下一篇1、让自己习惯c++
想对作者说点什么? 我来说一句

mapreduce的PPT

2014年12月30日 920KB 下载

没有更多推荐了,返回首页

关闭
关闭