一、提出任务
-
成绩表,包含四个字段(姓名、语文、数学、英语),只有三条记录
-
成绩表文件 -
scores.txt
张钦林 78 90 76 陈燕文 95 88 98 卢志刚 78 80 60
-
预备工作:启动集群的HDFS与Spark
-
将成绩文件 -
scores.txt
上传到HDFS上/input
目录
二、完成任务
(一)创建Maven项目
-
设置项目信息(项目名、保存位置、组编号、项目编号)
-
单击【Finish】按钮
-
将
java
目录改成scala
(二)添加依赖和构建插件
- 在
pom.xml
文件里添加依赖与Maven构建插件
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>net.qzj.rdd</groupId> <artifactId>SparkRDDDemo</artifactId> <version>1.0-SNAPSHOT</version> <dependencies>