- 博客(1)
- 收藏
- 关注
原创 RDD编程初级实践
需求描述 本次“RDD编程初级实践”实验分为三个部分:pyspark交互式编程、编写独立应用程序实现数据去重以及编写独立应用程序实现求平均值问题。 pyspark交互式编程:需要分析数据data.txt,该数据集包含了某大学计算机系的成绩,并据给定的实验数据,在pyspark中通过编程来计算以下内容: (1)该系总共有多少学生; (2)该系共开设了多少门课程; (3)Tom同学的总成绩平均分是多少; (4)求每名同学的选修的课程门数; (5)该系DataBase课程共有多少人选修; (6)各门
2021-06-14 16:42:11
1496
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人