《Hadoop权威指南》学习笔记(四)

1 Yarn的MapReduce工作流程

经典的MapReduce顶层包括5个独立实体 

  • 客户端,提交MapReduce作业
  • YARN资源管理器,协调集群上计算资源分配
  • YARN节点管理器,负责启动和监视集群中的container
  • MapReduce应用程序master,协调运行中的作业任务
  • 分布式文件系统(一般为HDFS),与其他实体间共享作业文件

提交作业的步骤,一张图就可以了,照着书上画的,加了一些解释,红色框表示节点

第7个步骤之后,如果该任务很小,master则会决定在当前节点运行这个任务,称为uber任务

任务会向master进程汇报当前任务进程,而客户端会以给定时间间隔从master查询作业状态

 2 Yarn失败

 Yarn中的失败包括:

  • 任务运行失败
  • master
  • 节点管理器
  • 资源管理器

2.1 任务运行失败

master进程会注意到任务失败并尝试再次启动任务,最大尝试次数由mapreduce.map.maxattemps设定。如果作业失败次数超过mapreduce.map.failures.maxpercent或者mapreduce.reduce.failures.maxpercent,就判定作业失败

2.2 master运行失败

yarn.resourcemanager.am.max-retries设置允许master失败的次数,默认为1次

master向资源管理器发送心跳,master失败后资源管理器在一个新容器总启动master。如果设置了yarn.app.mapreduce.am.job.recovery.enable为true,master可以恢复之前运行的任务状态

客户端会缓存master的地址,如果请求超时会向资源管理器请求新的master地址

2.3 节点管理器运行失败

节点管理器也会向资源管理器发送心跳,yarn.resourcemanager.nm.liveness-monitor.expiry-interval-ms决定资源管理器认为节点管理器失败的等待时间

如果应用程序的运行失败次数过高,节点管理器可能被master拉黑,mapreduce.job.maxtaskfailures.per.tracker设置拉黑阈值

2.4 资源管理器运行失败

那就歇菜了(大误)

管理员启动一个新的资源管理器,并恢复保存的状态,资源管理器只保存节点管理器和master,任务由master管理,这样有助于降低资源管理器的压力

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
  本书从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hado叩这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:haddoop简介:mapreduce简介:hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制:mapreduce的类型和格式;mapreduce的特性:如何安装hadoop集群,如何管理hadoop;pig简介:hbase简介:zookeeper简介,最后还提供了丰富的案例分析。   本书是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。   什么是谷歌帝国的基石?mapreduce算法是也!apache hadoop架构作为mapreduce算法的一种开源应用,是应对海量数据的理想工具。项目负责人tomwhite透过本书详细阐述了如何使用hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装和运行hadoop集群。   本书结合丰富的案例来展示如何用hadoop解决特殊问题,它将帮助您:    ·使用hadoop分布式文件系统(hdfs)来存储海量数据集,   通过mapreduce对这些数据集运行分布式计算    ·熟悉hadoop的数据和ilo构件,用于压缩、数据集成、序列化和持久处理    ·洞悉编~mapreduce实际应用时的常见陷阱和高级特性    ·设计、构建和管理一个专用的hadoop集群或在云上运行hadoop    ·使用高级查询语言pig来处理大规模数据    ·利用hadoop数据库hbase来保存和处理结构化/半结构化数据    ·学会使用zookeeper来构建分布式系统   如果您拥有海量数据,无论是gb级还是pb级,hadoop都将是您的完美解决方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值