- 博客(2)
- 收藏
- 关注
原创 2021-06-09
广州商学院 课程论文 题目: 使用python和spark对2020年美国新冠肺炎疫情数据分析 课 程 名 称 大数据技术与应用 考 查 学 期 2020-2021第2学期 考 查 方 式 考查(设计) 姓 名 何泽浩 学 号 201806110094 专 业 计科1802 成 绩 指 导 教 师 吉立建 一、实验平台搭建 1、安装Linux Ubuntu Kylin 16.04(因数据集较大,建议内存为3G) 2、安装Hadoop 3.1.3 安装教程 3
2021-06-10 00:04:19 269
原创 调用MapReduce对文件中各个单词出现次数进行统计
调用MapReduce对文件中各个单词出现次数进行统计 实验配置:系统:Ubuntu Kylin | 环境:Hadoop | 软件:Eclipse 文章目录一、安装Ubuntu二、准备工作1.创建Hadoop账户2.设置hadoop密码 :3.为hadoop用户增加管理员权限:4.更新 apt5.安装vim6.配置SSH三.安装Java环境1.安装JDK2.验证JDK安装情况3.设置JAVA坏境变量四.安装Hadoop五.Hadoop伪分布式配置1.修改配置文件2.格式化 NameNode4.校验安装五.
2020-12-19 22:02:03 267 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人