大数据（Hadoop）-MapReduce

最新推荐文章于 2024-07-18 14:25:20 发布

Olge

最新推荐文章于 2024-07-18 14:25:20 发布

阅读量394

点赞数

分类专栏： Code-Hadoop 文章标签：大数据 hadoop mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangdong2012/article/details/80617565

版权

MapReduce计算模型是大数据处理模式的鼻祖，这种模型很容易实现数据处理对并行化，并且编程模型简单，但对于复杂的运算逻辑往往需要大量的代码。

MapReduce任务涉及到的组件

在hadoop1.x中，MapReduce的运行依赖于JobTracker和TaskTracker，但在最新的hadoop版本中，以及被yarn替代，涉及到的主要组件有：
1）ResourceManager：负责整集群的资源管理和任务分配
2）NodeManager：负责单个节点的资源管理及执行任务
3）ApplicationMaster：负责当前Job的资源申请，任务调度以及错误处理等
4）Container：Yarn中资源的抽象，Task运行在Container所规则的资源边界内

MapReduce的运行模式

本地模式

本地模式是运行在程序员电脑上，以多线程的方式模拟MapReducer过程，适合本地调试

Yarn-Client

MapTask和ReduceTask运行在集群的NodeManager节点上，但ApplicationMaster运行在客户端，这种模式能够更好但观察到Job的运行情况

Yarn-Cluster

这种方式是将Task和ApplicationMaster都运行在NodeManager的Container上，好处是客户端可以快速返回，不用阻塞等待计算结果。但由于ApplicationMaster由ResourceManager分配

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据（Hadoop）-MapReduce

MapReduce计算模型是大数据处理模式的鼻祖，这种模型很容易实现数据处理对并行化，并且编程模型简单，但对于复杂的运算逻辑往往需要大量的代码。MapReduce任务涉及到的组件在hadoop1.x中，MapReduce的运行依赖于JobTracker和TaskTracker，但在最新的hadoop版本中，以及被yarn替代，涉及到的主要组件有： 1）ResourceManager：...
复制链接

扫一扫

专栏目录

Olge CSDN认证博客专家 CSDN认证企业博客

码龄8年

118: 原创

5万+: 周排名

68万+: 总排名

15万+: 访问

: 等级

2386: 积分

46: 粉丝

49: 获赞

43: 评论

177: 收藏

私信

关注

热门文章

分类专栏

最新评论

Java并发-AQS及各种Lock锁的原理
maizisan: CAS思想在Java中的实现体现在Unsafe类，Unsafe类基于系统源语言（C++）的操作实现了原子性。 AQS中的部分属性（state，waitStatus）被volatile修饰不保证原子性了，所以这里AQS使用Unsafe类的CAS操作保证其原子性，确保线程安全。Volatile+CAS操作也是保证线程安全的一种方式。要是说的不对，请指正（虚心的。
大数据（Kafka）-原理
Tisfy: 紫泉宫殿锁烟霞，欲取芜城作帝家。
ES 总结
原味吐司: 难得的好文
大数据（Kafka）-原理
Flume_Kafka: 既然CG中的C是并行读取数据，是如何保证C之间无重复读取，麻烦大神指点一下，一个C读取一个segment?麻烦大神指点一下
基于docker搭建hadoop集群
weixin_42927612: 麻烦你打字好好打

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。