RDD编程初级实践
RDD编程初级实践实验平台一、 pyspark交互式编程二、 编写独立应用程序实现数据去重三、 编写独立应用程序实现求平均值问题四、总结五、参考资料
实验平台
操作系统:Ubuntu16.04
Spark版本:2.4.0
Python版本:3.4.3
一、 pyspark交互式编程
提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:
Tom,DataBase,80
Tom,Algorithm,50
Tom,DataStructure,60
Jim,DataBase,90
原创
2021-06-06 17:51:56 ·
150 阅读 ·
1 评论