Linux系统中CentOS 7集成Hadoop伪分布式环境运行WordCount实例

阿里云上的伪分布式开发环境搭建完成后,来执行一下自带的例子,也就是单词统计实例(WordCount

1、创建输入目录

hadoop fs -mkdirinput

2、在输入目录中放入文件

hadoop fs -put/usr/test/abc.txt  input  把本地/usr/test目录里的abc.txt文件copyhdfs分布式文件系统的 /user/root/input(当前是root登录) 目录里面,因为当前目录就是root 所以 直接写input 就代表/user/root/input


在浏览器中输入ip+端口(x.x.x.x50070)进入网页,在Utilities-——>Browse the file system-——>user-——>root-——>abc.txt

3、执行单词统计指令


 执行完毕之后,执行hadoop fs -ls output,会发现如下


用命令 hadoop fs -cat output/part-r-00000 查看这个part-r-00000文件的内容,会看到执行的结果,也可以刷新浏览器,在root目录下output中查看,找到part-r-00000文件,将它下载下来打开查看。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值