- 博客(2)
- 收藏
- 关注
原创 RDD编程初级实践
目录一、实验内容1.pyspark交互式编程2.编写独立应用程序实现数据去重3.编写独立应用程序实现求平均值问题二、需求描述三、实验平台和环境搭建1.实验平台2.环境搭建四、数据上传五、实验步骤及过程1.pyspark交互式编程。2.编写独立应用程序实现数据去重。3.编写独立应用程序实现求平均值问题.一、实验内容1.pyspark交互式编程本作业提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:Tom,DataBase,80Tom,Algorithm,50Tom
2021-06-10 15:42:45 513
原创 Ubuntu的安装至文件MapReduce处理
一、在Windows中使用VirtualBox安装Ubuntu1.安装前的准备(1)打开VirtualBox,点击“创建”按钮,创建一个虚拟机 给虚拟机命名,选择操作系统,版本 如果您选择的系统是32位Ubuntu,那么版本请选择“Ubuntu (32 bit)” 如果您选择的系统是64位Ubuntu,那么版本请选择“Ubuntu (64 bit)” 如果界面中有“文件夹”选项,则在“文件夹”后面可以设置为本地磁盘目录,比如“D:\”。(2)选择内存大小
2020-12-17 21:18:58 821 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人