离线计算框架MapReduce

最新推荐文章于 2024-01-22 16:07:34 发布

匆匆z2

最新推荐文章于 2024-01-22 16:07:34 发布

阅读量581

点赞数

文章标签： yarn mapreduce

本文链接：https://blog.csdn.net/lo085213/article/details/103349090

版权

hadoop技术内幕-深入理解YARN架构设计与实现原理-第九章笔记

MapReduce基本构成组件

在这里插入图片描述

ContainerAllocator:与ResourceManager进行通讯,为MapReduce作业申请资源
ClientService:由MRClientService实现了MRClientProtocol协议,获取作业状态,控制作业
Job:表示一个MapReduce作业,维护了作业状态机
Task:表示一个作业中的某个任务,负责监控任务的状态,维护了任务状态机
TaskAttempt:表示一个任务运行的实例,直接使用了MRV1的逻辑,与MRv1处理引擎一样
TaskCleaner:处理进程失败之后产生的临时目录或垃圾结果,有线程池,异步删除
Speculator:完成推测执行功能.同一个任务,如果执行相对于其他任务较慢,则启动一个新的任务,执行同样的逻辑
ContainerLauncher:与NodeManager通信,以启动一个container
TaskAttemptListener:管理任务的心跳信息,如果某任务一段时间没有上报,任务已经挂掉
JobHistoryEventHandler:对作业的各个事件记录日志

事件与事件处理器

核心思想,当出现某一种事件时,MRAppMaster会查询<事件,事件处理器>,将该事件分配给对应的事件处理器
在这里插入图片描述

MapReduce客户端

MapReduce客户端是MapReduce与YARN通信的唯一途径,可以提交作业,获取作业运行状态,控制作业

两种RPC协议:

ApplicationClientProtocol ResourceManager实现了该协议,客户端都需要使用该协议完成作业提交,杀死作业,改变作业优先级
MRClientProtocol 启动applicationMaster之后,启动MRClientService服务,实现了该协议,通过该协议,直接与applicationMaster通信控制作业,查询作业运行状态,减轻ResourceManager负载

MRAppMaster工作流程

三种运行模式
本地模式:本地开发调试
Uber模式:小任务复用container
non-uber模式:MapTask和ReduceTask的四种状态:pending(启动未发送资源申请),scheduled(已经申请资源但未被分配),assigned(已经分配且运行),completed(运行完成)
优化参数,map 和reduce 的container分配方式,书中的三个参数
mapreduce.job.reduce.slowstart.completedmaps : map task完成比例达到该值后会为reduce task申请资源,默认0.05
yarn.app.mapreduce.am.job.reduce.rampup.limit : 在map task完成前,最多启动的reduce task的比例,默认0.5
yarn.app.mapreduce.am.job.reduce.preemption.limit : map task需要资源,但暂时不能获取时,保证至少一个map task可以得到资源,最多抢占reduce task的比例,默认0.5

在这里插入图片描述

MR作业生命周期及相关的状态机

job,task负责管理,taskAttempt负责实际的运行

MR作业生命周期

job状态机

task状态机

TaskAttempt状态机

资源申请与再分配

相关组件:MRAppMaster
YARN中作业资源可以用5元组描述:<priority,hostname,capability,containers,relax_locality>

priority :作业优先级
hostname :期望资源所在的host
capability :资源量(内存和cpu)
containers :container的数目
relax_locality :是否松弛本地性,设置为false只能申请同一节点上的资源,默认为true,本机资源不足时先同一机架,还没有资源再其他机架

资源申请过程

参考2.5节

资源再分配

MRAppMaster收到新分配的Container后,将这些Container进一步分配给各个任务,

1.判断收到的container资源是否满足要求,不满足则通过下次心跳通知RM释放该container
2.判断收到的container所在节点是否被加入黑名单,如果是,寻找一个与该container匹配的任务,并重新为该任务申请资源,同时心跳通知RM释放Container
3.根据container优先级分配给对应类型的任务