调用MapReduce对文件中各个单词出现的次数进行统计

最新推荐文章于 2024-05-24 09:45:00 发布

q5416407795

最新推荐文章于 2024-05-24 09:45:00 发布

阅读量700

点赞数

文章标签： mapreduce 大数据 hadoop eclipse

本文链接：https://blog.csdn.net/q5416407795/article/details/122243413

版权

本文档详细介绍了如何在Ubuntu 14.04环境下，使用Hadoop 2.6.0和Eclipse 3.8进行MapReduce编程。通过将一个包含10000个英文单词的文件上传到HDFS，然后编写并运行WordCount程序，统计文件中每个单词的出现次数，最后将结果下载到本地。

摘要由CSDN通过智能技术生成

文章目录

1.将待分析的文件（不少于10000英文单词）上传到HDFS。

2.调用MapReduce对文件中各个单词出现的次数进行统计。

3.将统计结果下载本地。

一、环境介绍

Ubuntu 14.04

Hadoop 2.6.0

Eclipse 3.8

JAVA环境

cd /usr/local/hadoop
./sbin/start-dfs.sh

jps查看是否启动成功

./bin/hdfs dfs -put /home/hadoop/xxx.txt input
./bin/hdfs dfs -ls input #查看是否上传成功

unzip -qo ~/下载/hadoop2x-eclipse-plugin-master.zip -d ~/下载    #解压到~/下载 中
sudo cp ~/下载/hadoop2x-ec

关注