HDFS文件上传，命令行模式执行WordCount自带实例

最新推荐文章于 2023-02-04 01:40:05 发布

薛倩

最新推荐文章于 2023-02-04 01:40:05 发布

阅读量1.4k

点赞数

分类专栏： BigData 文章标签：重要步骤 wordcount hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/flyfish111222/article/details/51360923

版权

BigData 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

以下命令均在/usr/local/hadoop下执行

 
       1. 新建文件夹input，新建文件input/file.txt 
 

mkdir input

echo "hello world hello hadoop" >>input/file.txt

2. 启动HDFS

./sbin/start-dfs.sh

以下所有的bin/都可以省略，因为环境变量里已经配置好了。

3. 将input文件夹上传至hdfs

上传到hdfs文件系统的根目录：bin/hadoop fs -put ./input /

或
创建家目录：bin/hadoop fs -mkdir /user/hadoop

上传到hdfs文件系统的家目录：bin/hadoop fs -put ./input /user/hadoop

为了简化命令以及便于区分不同用户，最好上传到家目录！

4. 执行(这个wordcount是HDFS自带的实例)
如果上传在根目录：

bin/hadoop jar wordcount ./share/hadoop/mapreduce/ hadoop-mapreduce-example-2.7.1.jar /input /output

如果上传在家目录：

bin/hadoop jar wordcount ./share/hadoop/mapreduce/ hadoop-mapreduce-example-2.7.1.jar input output

     5. 以递归的方式查看HDFS上所有文件（包括文件夹内的文件）
     如果上传在根目录：bin/hadoop fs -lsr /
     如果上传在家目录：bin/hadoop fs -lsr /user/hadoop
     6. 查看output文件夹内的输出结果（part-r-00000是output文件夹中的最后一个文件也就是最新创建的文件，即输出结果，文件名称因人而异）
     如果上传在根目录：bin/hadoop fs -tail /output/part-r-00000
     如果上传在家目录：bin/hadoop fs -tail output/part-r-00000 = bin/hadoop fs -tail /user/hadoop/output/part-r-00000

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS文件上传，命令行模式执行WordCount自带实例

以下命令均在/usr/local/hadoop下执行 1. 新建文件夹input，新建文件input/file.txtmkdir inputecho "hello world hello hadoop" >>input/file.txt 2. 启动HDFS./sbin/start-dfs.sh以下所有的bin/都可以省略，因为环境变量
复制链接

扫一扫

专栏目录

薛倩 CSDN认证博客专家 CSDN认证企业博客

码龄12年

46: 原创

17万+: 周排名

173万+: 总排名

25万+: 访问

: 等级

2021: 积分

161: 粉丝

84: 获赞

42: 评论

159: 收藏

私信

关注

热门文章

分类专栏

Python 18篇
JS 3篇
oracle 1篇
BigData 8篇
mychaos 1篇
Android 1篇
install 11篇
git 1篇
DataBase 10篇
linux 9篇
HBase 1篇
sqoop 3篇
MySQL 2篇
PM 1篇
eclipse
java 2篇
校招笔试 2篇
kettle 1篇
R 1篇
面经 2篇

最新评论

Ubuntu安装MySQL及遇到的问题解决方案
肖啊肖啊肖: 硬等把，吃个饭回来看看，不信就只能换其他解决办法了
Ubuntu安装MySQL及遇到的问题解决方案
可乐巨兽: 直接硬等吗哥
坚持写博客
chjiyun: 看你厦大那篇安装mongo日志过来的，码龄那么长的程序媛第一次见
大数据案例——Hive、MySQL、HBase数据互导
좌우: 为什么要先将数据放到mysql后再放到hbase
Ubuntu安装MySQL及遇到的问题解决方案
肖啊肖啊肖: 再次利用命令apt-get安装mysql-server，运行到Renaming removed key_buffer and myisam-recover options (if present)仍然卡住了，我再次中止了终端，发现启动也是成功的我也是好几次遇到这种问题，除了要卸载干净之外，遇到可以耐性等他一段时间发现就安装成功了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。