大数据学习之wordcount

最新推荐文章于 2023-07-21 13:19:49 发布

荔枝学长

最新推荐文章于 2023-07-21 13:19:49 发布

阅读量313

点赞数

分类专栏：大数据文章标签： java 大数据 hadoop hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LZW15082682930/article/details/113819942

版权

大数据专栏收录该内容

6 篇文章 0 订阅

订阅专栏

环境：Ubutun 16.04 + Java + HDFS +Hadoop

工具：VM 15.0 + IDEA +XShell 6+ Xftp 6

一、了解MapReduce模型：

二、代码编写，实现单词统计功能

1.导入MapReduce开发相关的jar包

2.打开IDEA开发工具，将jar包构建到项目中

3.创建项目

4.代码编写

WordCountMapper.java

WordCountReduce.java

WordCountMain.java

5.使用IDEA将项目打jar包

6.创建data.txt文件，请输入内容：

启动服务：

start-all.sh

7.上传文件到HDFS中：

hdfs dfs -put data.txt /

注：hdfs dfs -put 上传文件的路径 HDFS上的路径

\

在HDFS上创建输出文件outfile的存放位置：

hdfs dfs -mkdir /outfile

8. 将jar包上传并运行：

hadoop jar wordcount.jar /data.txt /out

hadoop jar jar包名 hdfs上的输入文件路径 hdfs上的输出文件路径

注：输出文件路径必须是不存在的，否则会报错。

9.查看统计结果：

项目地址：https://github.com/Li-zw/wordcount.git

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据学习之wordcount

环境：Ubutun 16.04 + Java + HDFS +Hadoop工具：VM 15.0 + IDEA +XShell 6+ Xftp 6一、了解MapReduce模型：二、代码编写，实现单词统计功能1.导入MapReduce开发相关的jar包2.打开IDEA开发工具，将jar包构建到项目中3.创建项目4.代码编写WordCountMapper.javaWordCountReduce.javaWordCoun..
复制链接

扫一扫

专栏目录

荔枝学长 CSDN认证博客专家 CSDN认证企业博客

码龄8年

41: 原创

40万+: 周排名

168万+: 总排名

13万+: 访问

: 等级

531: 积分

31: 粉丝

82: 获赞

31: 评论

386: 收藏

私信

关注

分类专栏

最新评论

ubuntu-20.04 安装Anaconda环境
荔枝学长: 你安装的是bash文件你指的是什么应用程序？
ubuntu-20.04 安装Anaconda环境
最厉害的小白啊: 你这样安装完了之后，没有应用程序阿，只有终端
MongoDB 使用报错 java.lang.NoSuchMethodError: com.mongodb.client.MongoCollection.insertOne(Ljava/lang/Ob
埋雷炸弹人: 如果我就是要两个都存在呢
ubuntu-20.04 安装Anaconda环境
荔枝学长: 如果你能够使用pyhton环境就行了没必要纠结为什么需要一样可能会因为操作系统版本或者 conda版本等原因显示不一样
ubuntu-20.04 安装Anaconda环境
bingo-001: 接上一条输入python3后就显示： Python 3.11.5 (main, Sep 11 2023, 13:54:46) [GCC 11.2.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> 学长你的输出结果python版本号后面时default，我的时main，不知道为什么但是我输入conda list 和conda -V都能正常显示，就是不显示python环境

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。