Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章 调优

HiveQL是一种声明式语言,用户会提交声明式的查询,而Hive会将其转换成MapReduce job。
**10.1 使用EXPLAN **
10.2 EXPLAN EXTENDED
10.3 限制调整
10.4 JOIN优化
将最大的表放置在JOIN语句的最右边。
如果所有表中有一个表足够小,是可以完成载入到内存中,那么Hive可以执行一个map-side JOIN,这样可以减少reduce过程,有时甚至可以减少某些map task任务。
10.5 本地模式
10.6 并行执行
10.7 严格模式
对于ORDER BY 语句的查询,要求必须使用LIMIT语句。因为ORDER BY为了执行排序过程会将所有的结果分发到同一个reducer中进行处理,强制要求用户增加这个LIMIT语句可以防止reducer额外执行很长一段时间。
10.8 调整mapper和reducer个数
10.9 JVM重用
10.10 索引
10.11 动态分区调整
10.12 推测执行

第11章 其他文件格式和压缩方法

第12章 开发

第13章 函数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值