- 博客(2)
- 收藏
- 关注
原创 2021-06-10
1、 需求描述 本次实验需要在Ubuntu系统下进行,需安装好spark和Python,以便操作,下面是此次试验的需求及分析 1.pyspark交互式编程 本作业提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示: Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBase,90 Jim,Algorithm,60 Jim,DataStructure,80 …… 请根据给定的实验数据,在pyspark中通
2021-06-10 13:18:38
1025
2
原创 期末大作业
大数据期末大作业 源文件 package org.apache.hadoop.examples; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWrit
2020-12-17 11:09:34
112
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人