- 博客(2)
- 收藏
- 关注
原创 RDD编程初级实践
RDD编程初级实践一、pyspark交互式编程二、编写独立应用程序实现数据去重三、编写独立应用程序实现求平均值问题 一、pyspark交互式编程 本作业提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示: Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBase,90 Jim,Algorithm,60 Jim,DataStructure,80 …… 请根据给定的实验数据,在pyspark中通过编程来
2021-06-05 12:59:42 1030 1
原创 基于Ubuntu Kylin系统在Hadoop的环境下调用MapReduce进行单词WordCount计数
在Hadoop的环境下调用MapReduce进行单词计数Hadoop安装创建hadoop用户更新apt安装SSH、配置SSH无密码登陆安装Java环境安装HadoopHadoop单机配置(非分布式)安装Eclipse配置Hadoop-Eclipse-Plugin在 Eclipse 中创建 MapReduce 项目进行WordCount,输出结果,保存到本地参考文献 Hadoop安装 本教程使用 Ubuntu 14.04 64位 作为系统环境(Ubuntu 12.04,Ubuntu16.04 也行,32位、6
2020-12-20 17:11:58 249 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人