一、提出任务
- 有多科成绩表,比如django.txt、java.txt、scala.txt,计算每个学生三科平均分
- Django成绩表【django.txt】
张三丰 88
李孟达 93
唐雨涵 97
王晓云 87
张晓琳 79
佟湘玉 89
杨文达 93
陈燕文 95
- Java成绩表 【java.txt]
张三丰 67
李孟达 78
唐雨涵 89
王晓云 75
张晓琳 93
佟湘玉 70
杨文达 87
陈燕文 90
- Scala成绩表 【scala.txt】
张三丰 89
李孟达 95
唐雨涵 92
王晓云 93
张晓琳 88
佟湘玉 88
杨文达 66
陈燕文 98
- 启动集群
- 在HDFS上新建/fff目录
- 在master虚拟机上创建三个成绩文件
- 将三个成绩文件上传到HDFS的/fff目录
- 查看三个成绩文件内容
二、完成任务
(一)新建Maven项目
- 添加项目信息(项目名、保存位置、组编号、项目编号)
- 点击【Finish】按钮
- 将java目录改成scala目录
(二)添加相关依赖和构建插件
- 在pom.xml文件里添加依赖与Maven构建插件
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>net.fhl.sql</groupId>
<artifactId>CalculateAverage</artifactId>
<version>1.0-SNAPSHOT</version>
<dependencies>
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.11.12</version>
</dependency>
<dependency>
<groupId