Impala实践之十五：Impala使用文档

最新推荐文章于 2023-05-22 14:17:24 发布

VIP文章木东居士

最新推荐文章于 2023-05-22 14:17:24 发布

阅读量4.1k

点赞数 1

分类专栏： Impala实践文章标签： impala 集群

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaodedong/article/details/52385862

版权

前言

由于前期大家使用Impala的时候都比较随意，再加上对Impala的原理不清楚，因此在使用的过程中对Impala带来了很大的压力。

经过前段时间的研究和实验。我整理了一份Impala使用文档，供组内小伙伴使用。

概述

针对大数据集群Impala组件的使用说明。包括使用原则、建议和规范。以下所有建议均建立在日常使用过程中总结的经验和实际测试结果之上。若有问题，请联系文档发布者。

读者对象

平台数据开发人员
平台数据分析人员
数据挖掘研发人员

元数据操作规范

总体说明：

只有通过hdfs增加或删除分区中文件后，才需要人为更新元数据，其余情况依赖impala自带更新机制即可。
通过hdfs增加或删除分区中文件后一律使用refresh tablename操作，性能损耗最低。
日常查询操作一律不加-r参数。如果出现提示元数据过期（该提示为目前版本bug，不必理会），可断开重连或者使用refresh操作。

注意： 如果在同一个shell脚本中，先执行了ddl操作，然后又对相应的库执行查询，会出现元数据同步延迟导致无法读取信息的操作。

refresh [tablename]（部分操作使用）

使用场景：

通过HDFS添加或删除分区下文件

使用规范：

通过hdfs在分

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Impala实践之十五：Impala使用文档

前言Impala集群中有两台机器的Impala Daemon不能正常启动，记录一下整个过程和解决方式。过程阶段一Impala集群的状态开始飘红，有两台节点不能正常使用。这时候发现集群里面有十多个任务正在运行，任务执行时间很长，情况非常不正常。看了一下sql的内容，有几个sql的确比较耗资源。阶段二此时，我先通知不要提交sql，给修复问题留点时间。正在重启不健康的节点，群里面就有人继续提交了不合理的s
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。