Hive
做一只精致IT小白
这个作者很懒,什么都没留下…
展开
-
Hive —【order by/sort by】
Order by Order by会对输入做全局排序,因此只有一个reduce(多个reduce无法保证全局有序) 只有一个reduce,会导致当前输入规模较大时,需要较长的计算时间。 Set hive.mapred.mode=nonstrict;(default value/默认值) Set hive.mapred.mode=strict; Order by 和数据库中的order by功能一致,按照某一项&几项排序输出。与数据库中的order by的区别在于hive.mapred.mode=原创 2020-11-11 00:33:51 · 470 阅读 · 0 评论 -
Hive(一)调优
Hive-调优 HiveQL是一种声明式语言,用户会提交声明式的查询,而Hive会将其转化为MapReduce job。 Hive-1 使用Explain(解析Hive如何转化为MapReduce) 一个Hive任务包含有一个或多个stage,不同的stage之间会存在着依赖关系。一个stage可以是一个MapReduce,也可以是【抽样、合并、limit限制】 Hive-2 使用Explain ...原创 2019-09-17 14:08:20 · 192 阅读 · 0 评论 -
Hive(二)函数
Hive常用函数原创 2019-10-11 11:01:19 · 120 阅读 · 0 评论