文章目录
一、提出任务
-
分组求TopN是大数据领域常见的需求,主要是根据数据的某一列进行分组,然后将分组后的每一组数据按照指定的列进行排序,最后取每一组的前N行数据。
-
在mysql数据库中创建数据表
t_grade
-
执行查询
-
将成绩文件 -
grades.txt
上传到HDFS上/input
目录
二、完成任务
(一)新建Maven项目
-
设置项目信息(项目名、保存位置、组编号、项目编号)
-
单击【Finish】按钮
-
将java目录改成scala目录
(二)添加相关依赖和构建插件
- 在
pom.xml
文件里添加依赖与Maven构建插件
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xs