Spark SQL案例：分组排行榜

最新推荐文章于 2024-05-29 09:40:17 发布

我非常爱学习

最新推荐文章于 2024-05-29 09:40:17 发布

阅读量194

点赞数

文章标签： spark hdfs big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_65838036/article/details/125327779

版权

该博客介绍了如何在Scala环境下，利用Spark处理HDFS上的数据，创建一个t-grade数据表，并进行操作。首先启动HDFS和Spark集群，然后将数据表上传到HDFS。接着，通过Maven构建Scala项目，添加相关依赖和插件。程序通过读取HDFS中的grades.txt文件，展示了如何在本地运行并查看结果。整个过程涉及到Spark SQL的使用和日志配置。

摘要由CSDN通过智能技术生成

首先先创建一个t-grade数据表

然后启动集群的hdfs和spark

将数据表上传到HDFS目录上

新建Maven项目

设置项目的信息和位置

将JAVA改成SCALA

添加相关依赖和构建插件

<?xml version=&#

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。