大数据之MapReduce了解及MapReduce Job提交到Yarn的工作流程

最新推荐文章于 2022-05-08 17:28:23 发布

仙人掌仙人

最新推荐文章于 2022-05-08 17:28:23 发布

阅读量747

点赞数

分类专栏： Bigdata learning 零基础 hadoop 大数据文章标签：大数据零基础 MapReduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Sylvia_D507/article/details/83241181

版权

MapReduce主要用途是进行分布式计算

一、MapReduce理解

宏观上的理解：
MapReduce仅仅是作为客户端（Client）把代码程序提交到Yarn平台上，MapReduce jar在Yarn上运行，属于客户端提交的过程，hdfs上传的命令。

MapReduce指的是Map()和Reduce()函数，正常写的代码是需要继承它的，但是企业上进行生产一般是不会用它，但是它也至关重要，因为它是做大数据计算的第一批组件，后面的很多大数据开发或开源的计算组件很多的思想理念都是以MapReduce为核心的，比如Spark、Hive（解决了MapReduce的一些痛点问题）。

首先
Map()函数是：映射
-----元素在映射过程中会变成（key,value）键值的的结构，元素个数不变。
例如：
----------(key,value)
x ------>(x,1)
y ------>(y,1)
Z ------>(z,1）

Reduce()函数：归约
-----计算合并，元素个数必然变少,将映射的规则进行统计
例如
-------- (key,value)
x ------>(x,1)
x ------>(x,1) ------->(x,1+1+1)
x ------>(x,1)
y ------>(y,1) ------->(y,1)

当然，如果将SQL语句输出的结果也如上所示形式，

最低0.47元/天解锁文章

仙人掌仙人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
大数据之MapReduce了解及MapReduce Job提交到Yarn的工作流程

MapReduce主要用途是进行分布式计算一、MapReduce理解宏观上的理解：MapReduce仅仅是作为客户端（Client）把代码程序提交到Yarn平台上，MapReduce jar在Yarn上运行，属于客户端提交的过程，hdfs上传的命令。MapReduce指的是Map()和Reduce()函数，正常写的代码是需要继承它的，但是企业上进行生产一般是不会用它，但是它也至关重要，因为...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。