学习 Hive（十）：窗口函数

最新推荐文章于 2023-11-03 10:05:15 发布

Zebul博

最新推荐文章于 2023-11-03 10:05:15 发布

阅读量261

点赞数

原文链接：http://dyingbleed.com/hive-10/

版权

窗口函数语法：

Function() OVER ([PARTITION BY <...>] [ORDER BY <...>] [Window Specification])

PARTITION BY 定义窗口分区，控制哪些数据行和当前数据行在同一个分区。

ORDER BY 定义窗口排序，控制分区内的排序方式，决定了当前行在分内的位置。

Window Specification 定义窗口帧，根据当前行的位置声明哪些行将包含在帧中。更多

表、数据集、分区、帧和行的关系如下图所示：

Window Functions

窗口函数可以分为三类：

样例数据：

需求：计算每个雇员所在部门的总工资额。

查询 SQL：

SELECT  
  name,
  department,
  salary,
  SUM(salary) OVER (PARTITION BY department) AS sum
FROM employee

查询结果：

name	department	salary	sum
Tom	A	5500	18500
Jerry	A	5000	18500
Lily	B	7000	14800
Lucy	A	8000	18500
Tony	B	3800	14800
Micheal	B	4000	14800

需求：计算每个雇员所在部门的工资排名。

查询 SQL：

SELECT  
  name,
  department,
  salary,
  RANK() OVER (PARTITION BY department SORT BY salary DESC) AS rank
FROM employee

查询结果：

name	department	salary	rank
Tom	A	5500	2
Jerry	A	5000	3
Lily	B	7000	1
Lucy	A	8000	1
Tony	B	3800	3
Micheal	B	4000	2

需求：计算每个雇员所在部门的最高工资。

查询 SQL：

SELECT  
  name,
  department,
  salary,
  FIRST_VALUE(salary) OVER (PARTITION BY department SORT BY salary DESC) AS first
FROM employee

查询结果：

name	department	salary	rank
Tom	A	5500	8000
Jerry	A	5000	8000
Lily	B	7000	7000
Lucy	A	8000	8000
Tony	B	3800	7000
Micheal	B	4000	7000

关注