Impala+kudu数仓经验及sql调优过程分享

本文分享了基于Impala的SQL执行优化,包括通过explain、summary、profile分析执行计划,强调了Join优化、数据写入策略、统计信息收集等方面。此外,还探讨了Impala+kudu架构在数据仓库中的应用经验,指出Kudu的分区问题、大批量删除效率、数据一致性挑战等关键点。
摘要由CSDN通过智能技术生成
文章分两部分
1 基于impala的sql执行优化过程
2 Impala+kudu架构的数据仓库经验分享

第一部分,sql调优

1.老生常谈,sql调优必看执行计划,无论是hive还是impala。查看impala的执行计划可以说比较详细,分为三个粒度,分别是:explain、summary、profile。
(1) impala-shell中执行explain sql,会打印sql语句的执行计划,每一步的解释如下图所示:
在这里插入图片描述

优点:查看执行计划,调整sql语句
缺点:不清楚sql的执行详情,调整sql语句只能凭经验

(2) 在sql执行完成后,执行summary可以 看到这条sql语句执行时所消耗的时间和资源的情况,还有Impala预估的资源使用
执行summary语句后打印情况如下图:
在这里插入图片描述

优点:明确sql每个阶段的执行时间以及资源占

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值