- 博客(2)
- 收藏
- 关注
原创 RDD编程初级实践
RDD编程初级实践## 一、需求分析本次实验需要统计:总共有多少学生;开设了多少门课程;Tom同学的总成绩平均分;每名同学的选修的课程门数;DataBase课程选修人数;门课程的平均分;选了DataBase这门课的人数;对于两个输入进行合并,并剔除其中重复的内容,得到一个新文件C;对于三个文件中求出所有学生的平均成绩,并输出到一个新文件中。## 二、环境介绍操作系统:Ubuntu16.04Spark版本:2.4.0Python版本:3.4.3## 三、数据来源描述提供分析的数据文件一共有A.
2021-06-10 02:40:41 657 2
原创 大数据Mapreduce统计
大数据Mapreduce统计一、准备工作1.创建hadoop用户代码如下$ sudo useradd -m hadoop -s /bin/bash2.设置密码,添加管理员权限$ sudo passwd hadoop$ sudo adduser hadoop sudo3.更新apt$ sudo apt-get update4.安装配置文件VIM$ sudo apt-get install vim5.安装SSH、配置SSH无密码登陆$ sudo apt-get install
2020-12-23 22:30:49 364
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人