2021-06-09
spark编程基础(python版)
一、实验目的
(1)熟悉Spark的RDD基本操作及添加链接描述键值对操作;
(2)熟悉使用RDD编程解决实际具体问题的方法。
二、实验平台
操作系统:Ubuntu16.04
Spark版本:2.1.0
Python版本:3.5
三、实验内容和要求
1.pyspark交互式编程
请到教材官网的“下载专区”的“数据集”中下载data01.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:
Tom,DataBase,80
Tom,Algorithm,50
Tom
原创
2021-06-09 17:44:18 ·
220 阅读 ·
2 评论