Hive 子查询

1.FROM中的子查询

SELECT ... FROM (subquery) name ...
SELECT ... FROM (subquery) AS name ...   (Note: Only valid starting with Hive 0.13.0)

Hive仅在FROM子句中支持子查询(从Hive 0.12版本开始)。必须为子查询指定名称,因为FROM子句中的每个表都必须具有名称。子查询 SELECT 列表中的列必须具有独一无二的名称。子查询 SELECT 列表中的列可以在外部查询中使用,就像使用表中的列一样。子查询也可以是带 UNION 的查询表达式。Hive支持任意级别的子查询。

在Hive 0.13.0及更高版本(HIVE-6519)中可选关键字 AS 可以包含的子查询名称之前。使用简单子查询的示例:

SELECT col
FROM (
  SELECT a+b AS col
  FROM t1
) t2

包含UNION ALL的子查询示例:

SELECT t3.col
FROM (
  SELECT a+b AS col
  FROM t1
  UNION ALL
  SELECT c+d AS col
  FROM t2
) t3

2. WHERE中的子查询

从Hive 0.13开始,WHERE子句中支持某些类型的子查询。可以将这些子查询的结果视为 IN 和 NOT IN 语句中的常量(我们也称这些子查询为不相关子查询,因为子查询不引用父查询中的列,如果引用了父查询的列,报错: SubQuery expression refers to Outer query expressions only.)

SELECT Id, LastName, FirstName, Address, City
FROM Persons
WHERE Id IN ( SELECT PersonId FROM Orders);

也可以支持 EXISTS 和 NOT EXISTS 子查询:

SELECT *
FROM Persons
WHERE EXISTS ( SELECT * FROM Orders WHERE Orders.PersonId = Persons.Id);

有一些限制:

子查询仅支持在表达式的右侧。
IN/NOT IN 子查询只能选择一列。
EXISTS/NOT EXISTS 必须有一个或多个相关谓词。
对父查询的引用仅在子查询的WHERE子句中支持。

Hive子查询(Subquery)是指在一个查询语句中嵌套另外一个完整的查询语句,用于限制或过滤结果集。在Hive中,子查询可以嵌套到SELECT、FROM、WHERE和HAVING子句中。 下面是一些示例: 1. 在SELECT子句中使用子查询 ``` SELECT name, age FROM student WHERE age = (SELECT MAX(age) FROM student); ``` 上面的查询语句中,子查询 `(SELECT MAX(age) FROM student)` 返回了student表中age列的最大值,它作为外部查询中的过滤条件,限制了结果集只包含age列的最大值所对应的记录。 2. 在FROM子句中使用子查询 ``` SELECT t1.name, t1.age, t2.avg_score FROM student t1 JOIN (SELECT AVG(score) as avg_score, class_id FROM score GROUP BY class_id) t2 ON t1.class_id = t2.class_id; ``` 上面的查询语句中,子查询 `(SELECT AVG(score) as avg_score, class_id FROM score GROUP BY class_id)` 返回了score表中每个班级的平均成绩。它作为外部查询的一个虚拟表,与student表进行JOIN操作,计算每个学生所在班级的平均成绩。 3. 在WHERE子句中使用子查询 ``` SELECT name, age FROM student WHERE class_id IN (SELECT class_id FROM score WHERE score >= 60); ``` 上面的查询语句中,子查询 `(SELECT class_id FROM score WHERE score >= 60)` 返回了score表中成绩大于等于60分的班级ID,它作为外部查询中的过滤条件,限制了结果集只包含在这些班级中的学生记录。 4. 在HAVING子句中使用子查询 ``` SELECT class_id, AVG(score) as avg_score FROM score GROUP BY class_id HAVING AVG(score) >= (SELECT AVG(score) FROM score); ``` 上面的查询语句中,子查询 `(SELECT AVG(score) FROM score)` 返回了整个score表的平均成绩,它作为外部查询的过滤条件,只保留班级平均成绩大于等于该值的记录。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值