一、提出任务
从python.txt、spark.txt、django.txt三科成绩表中计算每个学生三科平均分
在master
虚拟机上创建三个成绩文件
- django成绩表 :django.txt
1 张三丰 90
2 李孟达 85
3 王晓凯 87
4 黄德耀 93
5 罗萌萌 65
6 李新宇 76
7 王德志 78
8 张章雨 60
9 郭孟德 94
- python成绩表 :python.txt
1 张三丰 80
2 李孟达 65
3 王晓凯 77
4 黄德耀 83
5 罗萌萌 62
6 李新宇 70
7 王德志 68
8 张章雨 80
9 郭孟德 91
- java成绩表:java.txt
-
1 张三丰 95 2 李孟达 86 3 王晓凯 84 4 黄德耀 76 5 罗萌萌 92 6 李新宇 72 7 王德志 86 8 张章雨 90 9 郭孟德 61
启动集群的HDFS与Spark
java.txt、django,txt、java.txt
上传到HDFS上/score
目录
查看三个成绩文件内容