[hive] hive的调优手段总结

本文总结了Hive调优的各种方法,包括fetch抓取、本地模式、表的优化如大小表JOIN策略、去重统计优化、动态分区调整、合理设置map和reduce数量、并行执行、JVM重用和压缩技术,旨在提升Hive查询效率。
摘要由CSDN通过智能技术生成

推荐

总结hive只能有一个reduce运行的情况及改善方法

hive调优

1 fetch抓取

Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算
在hive-default.xml.template文件中hive.fetch.task.conversion默认是more,老版本hive默认是minimal,该属性修改为more以后,在全局查找、字段查找、limit查找等都不走mapreduce。

[hive-site.xml]

  <property>
    <name>hive.fetch.task.conversion</name>
    <value>more</value>
    <description>
  </property>

2 本地模式

在数据量比较小的时候,为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多,这时候hive可以通过本地模式在单台机器上处理所有的任务。

//开启本地模式
set hive.exec.mode.local.auto=true;  
//设置local mr的最大输入数据量,当输入数据量小于这个值时采用local  mr的方式,默认为134217728,即128M
set hive.exec.</
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值