先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。





既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)

正文
ROW_NUMBER()
在 Hive SQL 中,ROW_NUMBER()是一个用于生成行号的窗口函数。
它可以为查询结果集中的每一行分配一个唯一的行号。
以下是 ROW_NUMBER() 函数的基本语法:
ROW_NUMBER() OVER (PARTITION BY column1, column2, ... ORDER BY column3, column4, ...)
PARTITION BY子句可选,用于指定分区列,它将结果集划分为不同的分区。
每个分区内的行都会有独立的行号计数,即行号从1开始重新计数。ORDER BY子句用于指定排序列,它决定了如何对分区内的行进行排序。
行号将根据指定的排序顺序进行分配。
ROW_NUMBER() 函数可以与其他窗口函数(如 RANK() 和 DENSE_RANK())一起使用,以便对查询结果进行更复杂的分析和排序操作。
下面是一个示例,演示如何在 Hive SQL 中使用 ROW_NUMBER() 函数:
SELECT column1, column2, ...,
ROW_NUMBER() OVER (ORDER BY column3) as row_num
FROM your_table_name;
在这个示例中,column1、column2 等是查询结果集中的列名,your_table_name 是包含这些列的表名。
ROW_NUMBER() 函数通过 ORDER BY column3 按照 column3 列的值对结果集进行排序,
并为每一行分配一个行号,该行号将在结果集中的 row_num 列中显示。
请注意,ROW_NUMBER() 函数生成的行号是根据指定的排序顺序计算的,并且不会考虑分区之间的顺序。如果需要在分区内进行排序,请使用 ORDER BY 子句来定义排序列
文章目录
示例
当我们有一个名为 employees 的表,包含以下列:
- employee_id
- first_name
- last_name
我们希望为每个员工生成一个行号,并按照 employee_id 进行升序排序。
可以使用 ROW_NUMBER() 函数来实现这个需求,示例代码如下:
SELECT employee_id, first_name, last_name,
ROW_NUMBER() OVER (ORDER BY employee_id) AS row_num
FROM employees;
运行以上查询后,将会得到一个结果集,其中包含每个员工的 employee_id、first_name、last_name 以及对应的行号 row_num。
行号将根据 employee_id 的升序顺序分配。
示例输出可能如下所示:
+-------------+------------+-----------+---------+
| employee_id | first_name | last_name | row_num |
+-------------+------------+-----------+---------+
| 1 | John | Doe | 1 |
| 2 | Jane | Smith | 2 |
| 3 | David | Johnson | 3 |
| 4 | Sarah | Williams | 4 |
+-------------+------------+-----------+---------+
在这个示例中,每个员工都被赋予了一个唯一的行号,行号按照 employee_id 的升序进行分配。
窗口函数
窗口函数(Window Function)是一种在查询结果的特定窗口或分区上进行计算的函数。
它可以对查询结果集中的每一行应用聚合、排序或其他操作,并生成与该行相关的结果。
窗口函数通常与 OVER 子句一起使用,该子句定义了窗口的范围和排序方式。
通过指定 PARTITION BY 子句,可以将结果集划分为不同的分区,每个分区内的行将独立计算。
通过指定 ORDER BY 子句,可以对分区内的行进行排序,以确定窗口函数的计算顺序。
窗口函数可以用于执行各种分析任务,如计算排名、计算累计值、计算移动平均等。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
p204888 (备注大数据)**
[外链图片转存中…(img-PRyCuSFI-1713334308896)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
6万+

被折叠的 条评论
为什么被折叠?



