每天汇总----11.1

最新推荐文章于 2024-07-09 08:59:06 发布

豆豆总

最新推荐文章于 2024-07-09 08:59:06 发布

阅读量145

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39702831/article/details/83614789

版权

1.mapreduce分为哪两个阶段 map和reduce两个阶段

2.谈谈你对这两个阶段的理解 map阶段是对所有数据进行一个映射变换的操作，一般是将单个数据变成键值对的形式，这个可以在shuffle阶段重新分配数据，reduce是一个聚合计算的过程，将相同定义的数据进行统一计算

3.谈谈你对shuffle的理解洗牌，对数据进行重新分配的过程

4.运行wordcount案例跑在yarn上如果是使用hive来操作的话，我们将使用到explode，split，group by，count等函数或方法

5.mapreduce job跑在yarn的工作流程，简述 client将作业提交到RM上，RM将分配一个applicationMaster给这个作业，其在某个NM节点上的container，所以RM会要求某个NM开启这个container来放置applicationMaster，然后applicationMaster反向向RM注册并获取资源，接着向相应的NM通信要求启动container来运行task，每个container会定时和applicationMaster通信返回信息给applicationMaster以便于它监控每个task的运行情况，最后当作业运行完毕以后，RM注销掉applicationMaster。

7.executor是运行在RM节点上吗? NM节点上

8.APP master是运行在RM节点上吗？也是NM节点上

9.yarn调优的从内存的调优到cpu的调优，记住我以前博客上体到的那几个参数的设置，和内存的分配原则

10.一般我们把dn和nm部署在同一节点上，目的是什么数据本地化，减少网络io

11.yarn常用命令哪些 yarn application yarn jar等

12.调度器有哪几种先进先出，公平，队列

具体的请查看我其他博客，这里只是提点一下大概的内容，唤起记忆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。