hive本地模式设置

最新推荐文章于 2023-11-20 20:07:02 发布

IT小强哥

最新推荐文章于 2023-11-20 20:07:02 发布

阅读量901

点赞数 4

分类专栏： Hive 文章标签： hive

本文链接：https://blog.csdn.net/jackfeng86/article/details/117687432

版权

Hive 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

group by 需要跑多个ReduceTask，所以比较慢，怎么解决？

开启本地模式，也就是不让他在集群上跑，而是跑hive机器的本地hadoop上；

--查看hive本地执行模式状态
set hive.exec.mode.local.auto;
hive (default)> set hive.exec.mode.local.auto;
hive.exec.mode.local.auto=false
--修改为true
set hive.exec.mode.local.auto=true;
set hive.exec.mode.local.auto;
--测试速度--报错内存溢出了
select 
 deptno, avg(sal) avg_sal
from 
 emp
group by deptno;

从报错信息中看不出什么

在这里插入图片描述

去查看日志

tail -n 300 hive.log

在这里插入图片描述

内存溢出

在这里插入图片描述

free

查看内存情况

在这里插入图片描述

将hive-env.sh.template后缀.template去掉

默认HADOOP_HEAPSIZE为256 (MB)，设置成1024M

[fengxq@hadoop102 conf]$ mv hive-env.sh.template hive-env.sh

# The heap size of the jvm stared by hive shell script can be controlled via:
#
# export HADOOP_HEAPSIZE=1024
#
# Larger heap size may be required when running queries over large number of files or partitions.
# By default hive shell scripts use a heap size of 256 (MB).  Larger heap size would also be
# appropriate for hive server.

在这里插入图片描述

重启hiveservices.sh

修改成功

./bin/hiveservices.sh restart

在这里插入图片描述

如果对您有用，请帮忙点个赞，让我知道你在看！！！

IT小强哥

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
hive本地模式设置

group by 需要跑多个ReduceTask，所以比较慢，怎么解决？开启本地模式，也就是不让他在集群上跑，而是跑hive机器的本地hadoop上；--查看hive本地执行模式状态set hive.exec.mode.local.auto;hive (default)> set hive.exec.mode.local.auto;hive.exec.mode.local.auto=false--修改为trueset hive.exec.mode.local.auto=true;.
复制链接

扫一扫