MapReuce笔记一之概念简介

概念简述

简介

         MapReduce是一种计算框架,计算模型用来解决海量数据计算问题。在运行时一部分负责管理叫MRAppMaster运行在yarn容器中,剩下的统称为任务task也是在yarn容器中运行。

         MR分为Map阶段和Reduce阶段,Map读取hdfs中的数据经过处理后交给Reduce进行处理将结果存入hdfs中。实际工作中我们只需要实现map,reduce,dirver阶段的工作,其他的读取传输排序组合由框架完成。

 

         Map任务为一个java进程分布式运行在很多节点上,这样hdfs的海量数据就可以被很多的map任务处理。一个block对应一个map任务,比如hdfs数据由3个block组成就会有3个map任务来处理,这样可以并行进行数据处理。

       Map处理的结果会交给Reduce任务,而一般map任务和reduce任务不在同一个节点,map通过网络将数据传输给reduce,map和reduce分布执行不同的逻辑。Map读取hdfs数据是按照一行一个<k1,v1>键值对的形式进行读取的,K1为字节顺序,v1为一行的内容。

文件hello

         twofour

one two three

 

map函数

public void map(k1,v1,context){

         context.write(k2,v2);//执行map处理逻辑

}

Hdfs的文件hello中的会被解析为<0,two four>和<9,one two three>,第二行的第一个字节顺序是9。

 

框架会对map输出的<k2,v2>进行排序

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值