Hadoop的本地运行模式

最新推荐文章于 2022-05-19 18:00:46 发布

NFstriving

最新推荐文章于 2022-05-19 18:00:46 发布

阅读量859

点赞数 3

分类专栏：学习笔记文章标签：分布式 hadoop 大数据 java linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19659617/article/details/114098736

版权

学习笔记专栏收录该内容

28 篇文章 0 订阅

订阅专栏

Hadoop运行模式包括：本地模式、伪分布式模式，以及完全分布式模式。
1、本地模式
安装简单，在一台机器上运行服务，几乎不用做任何配置，但仅限于调试用途。没有分布式文件系统，直接读写本地操作系统的文件系统。
2、伪分布式模式
在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondary namenode等进程，模拟分布式运行的各个节点。配置已经很接近完全分布式。
3、完全分布式模式
正常的Hadoop集群，由多个各司其职的节点构成。

本地运行模式

需求

已经配置java环境
已经配置hadoop环境

一、官方Grep案例

1.在hadoop-2.7.2文件下面创建一个input文件夹

mkdir input

2.将Hadoop的xml配置文件复制到input

cp etc/hadoop/*.xml input

3.执行share目录下的MapReduce程序

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'，grep为匹配文本，input为输入文件的路径，output为输出文件的路径，'dfs[a-z.]+'为匹配的正则表达式。

因为配过环境变量，所以可以不写bin/，直接写hadoop jar。

注意：MapReduce执行时，如果输出路径存在，则会报错。
在这里插入图片描述

4.查看输出结果

cat output/*
在这里插入图片描述
也可以查看output目录下的part-r-00000文件。

二、官方WordCount案例

1.创建在hadoop-2.7.2文件下面创建一个wcinput文件夹

mkdir wcinput

2.在wcinput文件下创建一个wc.input文件

vim wcinput/wc.input

在文件中输入如下内容：
hadoop yarn
hadoop mapreduce
yarn hdfs
hadoop
在这里插入图片描述

3.执行程序

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput，wordcount为统计次数，wcinput为输入文件的路径，wcoutput为输出文件的路径。

注意：MapReduce执行时，如果输出路径存在，则会报错。
在这里插入图片描述

4.查看结果

cat wcoutput/part-r-00000
在这里插入图片描述

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。