项目场景:
最近入职新的公司,公司使用Impala进行查询分析,写篇简短的文章,纪念下新公司第一次查询优化分析 ~
项目主要需求:两张表需要进行关联操作,一张维表,一张流水表,然后取关联结果供下游业务部门进行使用。关于业务方面的数据分析就不展开,主要是技术上遇到的问题解决 ~
问题描述
假设维表为T1,流水表为T2,根据数据分析,需要通过T1的Key1或者Key2与T2的Key3关联,于是就有了想当然的以下代码~
SELECT
T1.*, T2.*
FROM T1
LEFT JOIN T2
ON (T1.Key1 = T2.key3 OR T1.Key2 = T2.