大数据系列(5)Mapreduce和Yarn简介

MapReduce简介

MapReduce是一种编程模型,是一种编程方法,是抽象的理论。

YARN概念
  • ResourceManager
  • ApplicationMaster
  • NodeManager
ResourceManager
  • 分配和调度资源
  • 启动并监控ApplicationMaster
  • 监控NodeManager
ApplicationMaster
  • 为MR类型的程序申请资源,并分配给内部任务
  • 负责数据的切分
  • 监控任务的执行及容错
NodeManager
  • 管理单个节点的资源
  • 处理来自ResourceManager的命令
  • 处理来自ApplicationMaster的命令
MapReduce编程模型
  • 输入一个大文件,通过Split之后,将其分为多个分片
  • 每个文件分片由单独的机器去处理,这就是Mao方法
  • 将各个机器计算的结构进行汇总并得到最终的结构这就是Reduce方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值