![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
面试知识点
张伯清
生钱的有效途径不是节流,而是开源。
展开
-
大数据Hive 面试以及知识点
转载:https://blog.csdn.net/haohaixingyun/article/details/52819588转载 2019-05-27 10:36:12 · 497 阅读 · 0 评论 -
最近经历的一些大数据(Spark/Hadoop)面试题
转载:https://blog.csdn.net/lxhandlbb/article/details/54599512转载 2019-05-27 10:56:15 · 123 阅读 · 0 评论 -
Mr 结合yarn的运行流程(运行逻辑)
1、为什么要使用YARN? 为了提升集群的利用率、资源统一管理, 使用YARN为上层应用提供统一的资源管理和调度的平台。 2、YARN的优势? 资源的统一管理和调度: 集群中所有节点的资源(内存、CPU、磁盘、网络等)抽象为Container。计算框架需要资源进行运算任务时需要向YARN申请Container, YARN按照特定的策略对资源进行调度进行Container的...原创 2019-05-28 09:23:28 · 756 阅读 · 0 评论 -
hive基础知识及性能优化(面试必备)
转载一:https://blog.csdn.net/u011331430/article/details/79038103 转载二:https://blog.csdn.net/yu0_zhang0/article/details/81776459 转载三:https://www.cnblogs.com/smartloli/p/4356660.html ...转载 2019-06-05 13:54:57 · 436 阅读 · 0 评论 -
简单搞定Shuffle机制运行原理(shuffle流程, Combiner合并)
转载:https://blog.csdn.net/github_36444580/article/details/75208992 2.4.1概述 1)mapreduce中,map阶段处理的数据如何传递给reduce阶段,是mapreduce框架中最关键的一个流程,这个流程就叫shuffle; 2)shuffle:洗牌、发牌(核心机制:数据分区、排序、缓存); 3)具体来说:就是将ma...原创 2019-05-28 16:20:44 · 894 阅读 · 0 评论