Impala
文章平均质量分 85
一个数据小开发
阿里巴巴集团码农一枚~欢迎一起交流学习进步
展开
-
Impala SQL on Kudu优化(二)
1、前言 上一篇 Impala SQL on Kudu优化谈到了如何从执行计划的角度来优化查询SQL,感兴趣的同学可以去回看关注下(Impala SQL on Kudu优化(一)_一个数据小开发的博客-CSDN博客),本篇优化将主要从建表层面来谈谈优化。2、概念&理念...原创 2021-09-23 19:45:29 · 679 阅读 · 1 评论 -
Impala SQL on Kudu优化(一)
一、Impala sql 的计算方式是啥?在使用Impala进行SQL查询的时候,我们经常会使用join来关联多个表进行查询,获取想要的结果。对于表的数量达到千万甚至上亿的时候,不同的join方式所造成的执行速度,可能差距非常大。Impala提供了两种Join算法-shuffle和broadcast。二、主要Join方式1.broadcast join适合大表与小表的join,将大表划分成多块,小表广播与这些块进行hash join。2.shuffler hash join适合大表与原创 2021-01-23 21:27:10 · 2915 阅读 · 5 评论