WordCount操作步骤

最新推荐文章于 2023-06-12 11:31:32 发布

ls.qz@qq.com

最新推荐文章于 2023-06-12 11:31:32 发布

阅读量2.7k

点赞数

文章标签： word count

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39888535/article/details/88054504

版权

WordCount操作步骤

启动Hadoop，注意！启动前需要格式化文件系统！启动后执行jps的结果进程应至少包含一个NameNode，一个DataNode，一个SecondaryNameNode
创建一个input目录（文件夹的路径大家自己选择，这里我保存在opt文件夹，新建了个WordCount文件夹）

mkdir /opt/WordCount
cd /opt/WordCount
mkdir input
cd input

在input目录下创建两个文本文件：text1.txt，text2.txt

echo "Hello Hadoop bye Hadoop">text1.txt
echo "Hello world Bye world">text2.txt

把input目录复制到HDFS文件系统中，并命名为in目录。若HDFS目录不存在，需提前创建。

hadoop fs -mkdir -p /WordCount/in
hadoop fs -put /opt/WordCount/input /WordCount/in

执行WordCount程序（进入个人电脑安装Hadoop的那个文件夹，打开相关文件路径，例如我的是在/home/hadoop/hadoop路径下）

cd /home/hadoop/hadoop/share/hadoop/mapreduce/
hadoop jar hadoop-examples-1.2.1.jar wordcount /WordCount/in/input /WordCount/out

稍等一段时间，任务就执行完成了，我们来看一下执行的结果

hadoop fs -ls /WordCount/out

这时的结果应该是有两个文件，其中一个叫part-r-00000，我们显示这个文件中的内容
hadoop fs -text /WordCount/out/part-r-00000

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
WordCount操作步骤

WordCount操作步骤启动Hadoop，注意！启动前需要格式化文件系统！启动后执行jps的结果进程应至少包含一个NameNode，一个DataNode，一个SecondaryNameNode创建一个input目录（文件夹的路径大家自己选择，这里我保存在opt文件夹，新建了个WordCount文件夹）mkdir /opt/WordCountcd /opt/WordCountmkdi...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。