获取原文
简短介绍
大家好,这些天要转凉了。注意多添几件衣服哦。同时人多的地方大家多注意防范新冠病毒,虽然国内控制了但是以防万一嘛。言归正传,今天给大家分享下HiveSql优化。
01-为什么要优化HiveSql
是不是有很多小伙伴,上完一天班之后感觉啥也没干呢?是不是每天就跑了几次HiveSql一天就结束了呢?
那么优化HiveSql可以给我们带来如下的提升:
-
1、有效的降低集群资源使用率
-
2、有效减少Sql执行耗时
-
3、有助于个人对Hive底层运行原理的理解
-
4、让个人拥有更多的充实感和成就感
是不是每天可以执行更多HiveSql了,做更多的数据需求了呢?^_^
02-MapReduce工作流程
了解底层技术引擎的工作流程,能够更好的告诉我们该如何优化。
MapReduce工作流程图
MapReduce工作流程图
说明