Hadoop 入门笔记—核心组件 MapRuduce

作者:幻好来源:恒生LIGHT云社区基本概念MapReduce 是一个分布式运算程序的编程框架,通过它能将用户将编写好的程序提交,并发运行在一个 Hadoop 集群上。MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序。MapReduce 是一个编程模型,分为两个阶段:Map 和 Reduce。输入的数据会先分块,然后由 Map 进行处理,最后输出到 Reduce 中。可以将它理解成对数据整理,然后归纳的一个过程。核心算法MapRed.
摘要由CSDN通过智能技术生成

作者:幻好

来源:恒生LIGHT云社区

基本概念

MapReduce 是一个分布式运算程序的编程框架,通过它能将用户将编写好的程序提交,并发运行在一个 Hadoop 集群上。

MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序。

MapReduce 是一个编程模型,分为两个阶段:Map 和 Reduce。输入的数据会先分块,然后由 Map 进行处理,最后输出到 Reduce 中。

可以将它理解成对数据整理,然后归纳的一个过程。

1175569-20180425120806546-505816034-1636883770385.png

核心算法

MapReduce 的算法计划通常分三个步骤组成:

  • Map:映射或映射器的工作是处理输入数据。每个工作节点将map 函数应用于本地数据,并将输出写入临时存储。
  • Shuffle:工作节点根据输出键重新分配数据,对数据映射排序、分组、拷贝,目的
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值