hive设置本地执行方式

当Hive中的SQL语句执行时间过长时,可以启用本地执行模式以优化性能。这包括在hive-env.sh或.hiverc文件中设置参数,如`hive.exec.mode.local.auto`,`hive.exec.mode.local.auto.inputbytes.max`和`hive.exec.mode.local.auto.input.files.max`。此外,还可以配置`hive.cli.print.current.db`以自动显示当前数据库。
摘要由CSDN通过智能技术生成

假如hive中的SQL语句执行时间太长,可以设置本地执行方式,设置本地执行模式可以优化执行速度,数据量小的时候,使用本地模式:。
方式一:(z)
在hive的配置文件 hive-env.sh中将一些配置注释解开

export HADOOP_HEAPSIZE=1024

在SQL绘画中执行一下语句:

set hive.exec.mode.local.auto=true;

方式二:(Y)

set hive.exec.mode.local.auto=true;
set hive.exec.mode.local.auto.inputbytes.max=134217728;
set hive.exec.mode.local.auto.input.files.max=4;

以上这些配置,都可以写在 hive 的conf 下的 .hiverc 文件中,当hive启动的时候,就会加载

在hive的家目录下的conf文件夹下,创建  .hiverc 文件
cd /opt/installs/hive/conf 下面
touch .hiverc

在这个文件的里面进行如下配置:
set hive.exec.mode.local.auto=true;
// 文件大小小于128M
set hive.exec.mode.local.auto.inputbytes.max=134217728;
// 分片数量小于等于4,相当于是4个map任务
set hive.exec.mode.local.auto.input.files.max=4;
每次不清楚当前在哪个数据库下面,需要使用
select current_database(); 查看才可以,非常的麻烦,
可以在.hiverc 中设置如下配置:
set  hive.cli.print.current.db=true;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值