hadoop之MR Job案例

Jaserok

于 2018-10-12 22:33:30 发布

阅读量451

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jaserok/article/details/83033733

版权

本文介绍了如何在Linux环境下操作Hadoop的HDFS分布式文件系统。通过`hdfs dfs -put`命令将文件上传到HDFS，并使用MapReduce执行grep任务。在MapReduce过程中，map和reduce任务可以并行执行。

摘要由CSDN通过智能技术生成

Linux 文件存储系统

HDFS 分布式文件存储系统

hdfs是架在linux上的分布式文件存储系统，如果要操作hdfs,必须在linux命令前加hdfs dfs

2.部署好hdfs，然后创建用户
在这里插入图片描述

3.bin/hdfs dfs -put etc/hadoop input （-put命令，把etc/hadoop这个目录放到input这个目录下，input就是指当前所在的目录即/uer/hadoop这个目录下）在这里插入图片描述

4. 在这里插入图片描述

5.bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar grep input output ‘fs[a-z.]+’ 在这里插入图片描述

6.map和reduce在跑的过程中，并不是一个跑完另一个再跑，可同时进行，如下图在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Jaserok CSDN认证博客专家 CSDN认证企业博客

码龄6年

58: 原创

11万+: 周排名

140万+: 总排名

5万+: 访问

: 等级

990: 积分

6: 粉丝

6: 获赞

6: 评论

21: 收藏

私信

关注

热门文章

分类专栏

000 2篇

最新评论

Yarn的调度器与vcore
CCESARE: 灵魂画手牛逼
HDFS之 put命令权限问题剖析和文件系统常用命令
Deep Learning小舟: 感谢博主分享，写的挺不错，希望后面有更多的文章。(^ ^)
HDFS详解之块大小和副本数
abc444873863 回复 weixin_44697505: 这个题目的 “实际存储空间多少”问的有问题，如果指的是HDFS文件系统中占用多少，为 128*4=512。如果指的是实际占用的磁盘空间，则是 (128+32)*2=320，第二个块虽然在HDFS中是128，但在磁盘中，只会占用32
HDFS详解之块大小和副本数
weixin_44697505: 实际存储空间不是块大小乘以4吗？文件拆分成两个块，每个块128M，2个副本，就是2*128*2=512M 啊
HDFS详解之块大小和副本数
qq_29405199 回复 SmallbenClock: 160m的文件占了2个数据块

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。