Spark SQL案例: 分组排行榜

该博客介绍了如何在Scala环境下,通过Maven项目配置,处理上传到HDFS的grades.txt文件,创建并运行一个程序来生成成绩的分组排行榜。主要步骤包括设置项目信息、添加相关依赖、创建日志属性文件、实现排行榜单例对象,并在本地运行程序查看输出结果。
摘要由CSDN通过智能技术生成

一、提出任务

  • 创建数据表t_grade

 

预备工作:启动集群的HDFS与Spark

将成绩文件 - grades.txt上传到HDFS上/input目录

三、完成任务

(一)新建Maven项目

  • 设置项目信息(项目名、保存位置、组编号、项目编号)

 将java目录改成scala目录

 

(二)添加相关依赖和构建插件

 

 

(三)创建日志属性文件

  • 在资源文件夹里创建日志属性文件 - log4j.properties

 

 

(四)创建分组排行榜单例对象

  • 在net.cb.sql包里创建GradeTopNBySQL单例对象

 

(五)本地运行程序,查看结果

  • 在控制台查看输出结果

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值