MapReduce计数实例

MapReduce计数实例

MapReduce 简介

MapReduce 是Hadoop的分布式计算系统,是一个分布式运算程序的编程框架。
为什么需要MapReduce

  • 海量数据在单机上处理受硬件限制,效率不高
  • 分布式程序开发困难
  • 引入MapReduce后,开发人员可以将大部分工作集中于业务逻辑的开发,将分布式计算的复杂性交给框架处理。

MapReduce计数

本实例是基于Hadoop2.8.5的伪分布式平台。如果jps命令执行后如下图所示,则伪分布式搭建完成。Hadoop伪分布式和完全分布式的搭建后续会进行更新?。
jps显示的java进程

  1. 先将本地一个文件上传到HDFS
    hadoop fs -put README.txt /
    上述/表示将README.txt 上传至HDFS根目录下,也可先创建目录再指定目录上传。

  2. 查看是否上传成功
    hadoop fs -ls

  3. 进入mapreduce目录
    cd /usr/local/hadoop/share/hadoop/mapreduce

  4. 执行countword程序
    hadoop jar hadoop-mapreduce-examples-2.8.5.jar wordcount /README.txt /count.txt
    上述表示执行wordcount程序,输入为README.txt ,输出为count.txt,都放在根目录下。
    hadoop fs -ls /count.txt查看countword执行后输出在count.txt目录下那个文件中
    count.txt目录
    hadoop fs -cat /count.txt/part -r -00000显示结果
    计数结果
    如上图所示,结果为README.txt中各单词的个数。

参考博客,感谢大佬!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值