- 博客(2)
- 收藏
- 关注
原创 2021-06-10
RDD编程初级实践Spark编程基础(Python版)一、实验目的(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统:Ubuntu16.04Spark版本:2.4.0Python版本:3.4.3三、实验内容和要求1.pyspark交互式编程本作业提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:Tom,DataBase,80Tom,Algorithm,50Tom,DataStruc
2021-06-10 19:31:09 462
原创 Hadoop综合
Hadoop综合一、安装 Hadoop 前还需要做一些必备工作1.创建hadoop用户:首先按 ctrl+alt+t 打开终端窗口,输入如下命令创建新用户 :sudo useradd -m hadoop -s /bin/bash这条命令创建了可以登陆的 hadoop 用户,并使用 /bin/bash 作为 shell2.接着使用如下命令设置密码,可简单设置为 hadoop,按提示输入两次密码:sudo passwd hadoop可为 hadoop 用户增加管理员权限,方便部署,避免一些对新手来
2020-12-25 19:40:06 287 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人