Hive JOIN过滤条件位置玄学:ON vs WHERE的量子纠缠

Hive JOIN过滤条件位置玄学:ON vs WHERE的量子纠缠

作为数据工程师,Hive JOIN就像吃火锅选蘸料——放错位置味道全变!今天带你破解字节/阿里等大厂高频面试题:ON和WHERE后的过滤条件究竟有什么不同?

一、核心差异对比表

特性 ON子句 WHERE子句
执行时机 JOIN操作时 JOIN完成后
影响范围 单表过滤(左右表独立) 两表JOIN后的结果集
NULL值处理 保留未匹配的主表记录 过滤掉所有不满足条件的记录
执行计划优化 可能触发谓词下推(Predicate Pushdown) 无法下推到JOIN前阶段
典型应用场景 外连接时保留主表数据 内连接后的最终结果过滤

二、INNER JOIN的量子叠加态

示例数据

-- 用户表
CREATE TABLE users (
    user_id INT,
    city STRING
);

-- 订单表 
CREATE TABLE orders (
    order_id INT,
    user_id INT,
    amount DECIMAL
);

实验组1:条件在ON子句

SELECT *
FROM users u
JOIN orders o 
ON u.user_id = o.user_id 
   AND o
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值