实现目录 一、pyspark交互式编程 1.该系总共有多少学生 2.该系共开设了多少门课程 3.Tom同学的总成绩平均分是多少 4.求每名同学的选修的课程门数 5.该系DataBase课程共有多少人选修 6.各门课程的平均分是多少 7.使用累加器计算共有多少人选了DataBase这门课 二、编写独立应用程序实现数据去重 1.导入数据及代码 2.运行结果 三、编写独立应用程序实现求平均值问题 1.导入数据及代码 2.运行结果 一、pyspark交互式编程 首先我们需要先提供某大学计算机系的成绩,数据格式如下(仅供参考) Aaron,OperatingSystem,100 Aaron,Python,50 Aaron,ComputerNetwork,30 Aaron,Software,94 Abbott,DataBase,18 Abbott,Python,82 Abbott,ComputerNetwork,76 Abel,Algorithm,30 Abel,DataStructure,38 A