impala set设置之NUM_NODES

cclovezbf

于 2023-04-03 12:06:12 发布

阅读量521

点赞数

分类专栏： impala 文章标签： impala set

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cclovezbf/article/details/129923958

版权

impala 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

如何使用Impala合并小文件_Hadoop实操的技术博客_51CTO博客

起因是看到这篇文章。

还是以这个sql为例

select count(1)
from odserpjdata_kd.gl_code_combinations gcc, -- 1E
odserpjdata_kd.gl_balances gb -- 1000w
where gb.code_combination_id=gcc.code_combination_id --3000w

直接explain sql

set NUM_NODES=1;

explain sql

可以看到单节点的时候，所需要的内存变大了。

到clouder manager里看查询时间变长，但是内存这块对于单节点负荷肯定变大

----------------------------------------------------------------------------------

看看官方文档

1.限制在查询时使用的节点数，一般用于debug的时候。注意2点，query和debug

2. =0代表所有节点，或者=1 代表协调节点 (我说我设置=3 =10 和没设置一样。。)

3. 一般是你怀疑由于分布式查询出现了结果错误，就用这个模式debug下

4.直接点 set NUM_NODES=1 可以减少小文件！！！

5.少用。因为单节点占用内存多，会直接和其他分布式sql查询抢夺资源，导致其他查询慢。

-----至于小文件

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
impala set设置之NUM_NODES

2. =0代表所有节点，或者=1 代表协调节点 (我说我设置=3 =10 和没设置一样。1.限制在查询时使用的节点数，一般用于debug的时候。因为单节点占用内存多，会直接和其他分布式sql查询抢夺资源，导致其他查询慢。到clouder manager里看查询时间变长，但是内存这块对于单节点负荷肯定变大。3. 一般是你怀疑由于分布式查询出现了结果错误，就用这个模式debug下。4.直接点 set NUM_NODES=1 可以减少小文件！可以看到单节点的时候，所需要的内存变大了。-----至于小文件。
复制链接

扫一扫

专栏目录

cclovezbf CSDN认证博客专家 CSDN认证企业博客

码龄6年

229: 原创

3万+: 周排名

8537: 总排名

46万+: 访问

: 等级

3714: 积分

215: 粉丝

358: 获赞

109: 评论

952: 收藏

私信

关注

分类专栏

最新评论

hadoop学习之WebHDFS (REST API)
cclovezbf: clouder manger 就是cdp cdh自带的
hadoop学习之WebHDFS (REST API)
TangAcrab: 用得什么工具看得 ui 哦
bucketId out of range: -1 (state=,code=0)
cclovezbf: 用什么工具同步的？
bucketId out of range: -1 (state=,code=0)
cclovezbf: 而且为啥不建orc ，除非你是直接load的？如果确实要用text 可以设置分隔符@$@ 这连续的三个字段这种总不会有相似的了吧
bucketId out of range: -1 (state=,code=0)
cclovezbf: 很简单啊在oracle建个试图 replace('\n','')这种比如用datax的话直接在column哪里也可以replace

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。