Spark SQL案例：分组排行榜

Unity623

于 2022-06-23 17:12:35 发布

阅读量71

点赞数

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_67240302/article/details/125430760

版权

一、提出任务

分组求TopN是大数据领域常见的需求，主要是根据数据的某一列进行分组，然后将分组后的每一组数据按照指定的列进行排序，最后取每一组的前N行数据。
有一组学生成绩数据

查看mysql数据表t_score

预备工作：启动集群的HDFS与Spark

二、完成任务

（一）新建Maven项目

设置项目类型

增加scala目录

（二）添加相关依赖和构建插件

在pom.xml 添加依赖

（三）创建日志属性文件

添加log4j.properties日志文件

（四）创建分组排行榜单例对象

创建GradeTopNSQL单例对象

编写GradeTopNSQL代码

（五）本地运行程序，查看结果

在控制台查看输出结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。