hadoop
文章平均质量分 79
肿么肥四啊哈
这个作者很懒,什么都没留下…
展开
-
Hadoop面试-HDFS,MapReduce,Yarn
Hadoop面试HDFS###1.hdfs写流程(1)客户端通过 Distributed FileSystem 模块向 NameNode 通信请求上传文件,NameNode 检查目标文件是否已存在,父目录是否存在。(2)NameNode 返回是否可以上传。(3)客户端请求第一个 Block 上传到哪几个 DataNode 服务器上。(4)NameNode 返回 3 个 DataNode 节点,分别为 dn1、dn2、dn3。(5)客户端通过 FSDataOutputStream 模块请求 d原创 2021-08-11 23:08:06 · 520 阅读 · 0 评论 -
Partitioner的使用以及原理
Partitioner简介shuffle是通过分区partitioner 分配给Reduce的 一个Reducer对应一个记录文件Partitioner是shuffle的一部分partitioner执行时机:在mapper执行完成,Reducer还没有执行的时候,mapper的输出就是partitioner的输入 即<k2,v2>partitioner 分区主要是用来提高效率的 例如从全国基站的数据中查找北京基站的数据,如果计算时不分区全国的数据都放在一起,查询的时候就相当于全表扫描 效率非常转载 2021-05-05 16:23:23 · 713 阅读 · 0 评论