调用MapReduce对文件中各个单词出现的次数进行统计

本文档详细介绍了如何在Ubuntu 14.04环境下,使用Hadoop 2.6.0和Eclipse 3.8进行MapReduce编程。通过将一个包含10000个英文单词的文件上传到HDFS,然后编写并运行WordCount程序,统计文件中每个单词的出现次数,最后将结果下载到本地。
摘要由CSDN通过智能技术生成

文章目录


需求描述

1.将待分析的文件(不少于10000英文单词)上传到HDFS。

2.调用MapReduce对文件中各个单词出现的次数进行统计。

3.将统计结果下载本地。


一、环境介绍

Ubuntu 14.04

Hadoop 2.6.0

Eclipse 3.8

JAVA环境

二、具体步骤

1.将一个10000字英语单词的文件直接拖到hadoop中

2.启动hadoop

cd /usr/local/hadoop
./sbin/start-dfs.sh

jps查看是否启动成功

3.将文件上传至HDFS并查看是否成功

./bin/hdfs dfs -put /home/hadoop/xxx.txt input
./bin/hdfs dfs -ls input #查看是否上传成功 

4.在应用商店中下载Eclipse

5.安装Hadoop-Eclipse-Plugin

unzip -qo ~/下载/hadoop2x-eclipse-plugin-master.zip -d ~/下载    #解压到~/下载 中
sudo cp ~/下载/hadoop2x-ec
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值