调用MapReduce对文件中各个单词出现次数进行统计

最新推荐文章于 2024-06-05 10:53:25 发布

star.Lin

最新推荐文章于 2024-06-05 10:53:25 发布

阅读量1.7k

点赞数

文章标签：大数据 hadoop

本文链接：https://blog.csdn.net/weixin_48073650/article/details/111346369

版权

调用MapReduce对文件中各个单词出现次数进行统计

实验配置：系统:Ubuntu Kylin | 环境：Hadoop | 软件：Eclipse

要求
1.将待分析的文件（不少于10000英文单词）上传到HDFS
2.调用MapReduce对文件中各个单词出现的次数进行统计
3.将统计结果下载本地。

操作步骤：调用MapReduce执行WordCount对单词进行计数**
一：
• 1. 在Eclipse中创建项目
• 2. 为项目添加需要用到的JAR包
• 3. 编写Java应用程序
• 4. 编译运行程序
• 5. 应用程序部署

二：
• 1. 在Eclipse中创建项目
• 2. 为项目添加需要用到的JAR包
• 3. 编写Java应用程序
• 4. 编译打包程序
• 5. 运行程序

（一）：
1.打开Eclipse，需要填写workspace(工作空间)，用来保存程序所在的位置，这里按照默认，不需要改动，如下图，点击“OK”按钮，进入Eclipse软件。
在这里插入图片描述
2.选择“File->New->Java Project”菜单，开始创建一个Java工程，如下图所示

（二):
1.进行下一步设置，如下图

2.点击界面中的“Libraries”选项卡，然后，点击界面右侧的“Add External JARs…”，如下图

3.进入到common目录，然后，界面会显示出common目录下的所有内容，用鼠标点击选中hadoop-common-2.7.1.jar和haoop-nfs-2.7.1.jar，然后点击界面右下角的“确定”按钮，就可以把这两个JAR包增加到当前Java工程中，如下图
在这里插入图片描述

从这个界面中可以看出，hadoop-common-2.7.1.jar和haoop-nfs-2.7.1.jar已经被添加到当前Java工程中。然后，按照类似的操作方法，可以再次点击“Add External JARs…”按钮，把剩余的其他JAR包都添加进来。需要注意的是，当需要选中某个目录下的所有JAR包时，可以使用“Ctrl+A”组合键进行全选操作。全部添加完毕以后，就可以点击界面右下角的“Finish”按钮，完成Java工程HDFSExample的创建。
（三）：
1.在创建好的工程名称“HDFSExample”右键菜单中
选择New->Class，如下图
在这里插入图片描述

最低0.47元/天解锁文章

star.Lin

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
调用MapReduce对文件中各个单词出现次数进行统计

调用MapReduce对文件中各个单词出现次数进行统计实验配置：系统:Ubuntu Kylin | 环境：Hadoop | 软件：Eclipse要求1.将待分析的文件（不少于10000英文单词）上传到HDFS2.调用MapReduce对文件中各个单词出现的次数进行统计3.将统计结果下载本地。操作步骤：调用MapReduce执行WordCount对单词进行计数**一：• 1. 在Eclipse中创建项目• 2. 为项目添加需要用到的JAR包• 3. 编写Java应用程序• 4. 编译
复制链接

扫一扫