weixin_48070439-CSDN博客

原创 2021-06-09

广州商学院课程论文题目：使用python和spark对2020年美国新冠肺炎疫情数据分析课程名称大数据技术与应用考查学期 2020-2021第2学期考查方式考查（设计）姓名何泽浩学号 201806110094 专业计科1802 成绩指导教师吉立建一、实验平台搭建 1、安装Linux Ubuntu Kylin 16.04（因数据集较大，建议内存为3G） 2、安装Hadoop 3.1.3 安装教程 3

2021-06-10 00:04:19 285

原创调用MapReduce对文件中各个单词出现次数进行统计

调用MapReduce对文件中各个单词出现次数进行统计实验配置：系统:Ubuntu Kylin | 环境：Hadoop | 软件：Eclipse 文章目录一、安装Ubuntu二、准备工作1.创建Hadoop账户2.设置hadoop密码 :3.为hadoop用户增加管理员权限:4.更新 apt5.安装vim6.配置SSH三.安装Java环境1.安装JDK2.验证JDK安装情况3.设置JAVA坏境变量四.安装Hadoop五.Hadoop伪分布式配置1.修改配置文件2.格式化 NameNode4.校验安装五.

2020-12-19 22:02:03 277 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 2021-06-09

原创 调用MapReduce对文件中各个单词出现次数进行统计

空空如也

空空如也

原创调用MapReduce对文件中各个单词出现次数进行统计