调用MapReduce对文件中各个单词出现的次数进行统计

最新推荐文章于 2022-10-15 20:14:38 发布

葉晓

最新推荐文章于 2022-10-15 20:14:38 发布

阅读量1.4k

点赞数

文章标签： mapreduce ubuntu eclipse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tanrongkun/article/details/122245750

版权

本次运行，我们需要实现的是调用 MapReduce 对文件中各个单词出现的
次数进行统计。要求在 Linux 系统中实现上述操作。首先要安装 Ubuntu 系统，
然后要配置 Java 环境，安装 JDK。Ubuntu 提供了一个健壮，功能丰富的计算环
境。
一、环境介绍
在 VitrtualBox 上安装 Ubuntu。在 Ubuntu 中安装 Hadoop，Eclipse。安装 JAVA
环境，下载文件 jdk-8u162-linux-x64.tar.gz。配置 Hadoop 伪分布式。在 Ubuntu
软件中心中下载并安装 Eclipse。安装好后，把待分析的文件上传到 HDFS，然
后在 Eclipse 中创建 MapReduce 项目，创建 Java 工程，为项目添加需要用到
的 JAR 包。
二、数据来源及数据上传
准备一个待分析的 10000 字英文单词文件，命名为 ljh.txt。使用 Firezilla
将 ljh.txt 文件传到 hadoop 中

三，浏览 Gutenberg网站下载一遍英语文献《孩子与梦想》

上传至/usr/local/hadoop目录下便于后续操作

四、数据上传结果查看

将数据上传至hdfs中，需要确保hadoop是开启状态

五、数据处理过程的描述

首先安装eclipse

安装完成后需要配置Hadoop-Eclipse-Plugin，将插件导入后，运行eclipse -clean打开eclipse

在preference中填入hadoop的安装地址

切换MapReduce视图

在MapReduce locations连接hadoop（配置参数需要和hadoop的配置文件core-site.xml一致）

配置完毕后可以在左边看到实验文件

创建MapReduce项目

在运行程序前需要将我们的配置文件复制到我们项目下

运行项目

六、处理结果的下载及命令行展示

运行完毕后会在output生成文件part-r-00000

将运行结果下载本地

七、经验总结

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
调用MapReduce对文件中各个单词出现的次数进行统计

本次运行，我们需要实现的是调用 MapReduce 对文件中各个单词出现的次数进行统计。要求在 Linux 系统中实现上述操作。首先要安装 Ubuntu 系统，然后要配置 Java 环境，安装 JDK。Ubuntu 提供了一个健壮，功能丰富的计算环境。一、环境介绍在 VitrtualBox 上安装 Ubuntu。在 Ubuntu 中安装 Hadoop，Eclipse。安装 JAVA环境，下载文件 jdk-8u162-linux-x64.tar.gz。配置 Hadoop 伪分布式。在 Ubu...
复制链接

扫一扫

葉晓 CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

152万+: 周排名

146万+: 总排名

1461: 访问

: 等级

10: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

调用MapReduce对文件中各个单词出现的次数进行统计 1463

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。