安装Linux以及搭建Hadoop3.1.2集群(5)——Hadoop运行模式

第六章 Hadoop运行模式

Hadoop运行模式包括:

  • 本地模式、伪分布式模式以及完全分布式模式。
  • Hadoop官方网站:
http://hadoop.apache.org/

6.1 本地运行模式

6.1.1 官方Grep案例

  1. 创建在hadoop-3.1.2文件下面创建一个input文件夹
[zpark@hadoop104 hadoop-3.1.2]$ mkdir input
  1. 将Hadoop的xml配置文件复制到input
[zpark@hadoop104 hadoop-3.1.2]$ cp etc/hadoop/*.xml input
  1. 执行share目录下的MapReduce程序
[zpark@hadoop104 hadoop-3.1.2]$ bin/hadoop jar
share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.2.jar grep input output 'dfs[a-z.]+'
  1. 查看输出结果
[zpark@hadoop104 hadoop-3.1.2]$ cat output/*

6.1.2 官方WordCount案例

  1. 创建在hadoop-3.1.2文件下面创建一个wcinput文件夹
[zpark@hadoop104 hadoop-3.1.2]$ mkdir wcinput
  1. 在wcinput文件下创建一个wc.input文件
[zpark@hadoop104 hadoop-3.1.2]$ cd wcinput
[zpark@hadoop104 wcinput]$ touch wc.input
  1. 编辑wc.input文件
[zpark@hadoop104 wcinput]$ vi wc.input

在文件中输入如下内容

hadoop yarn
hadoop mapreduce
zhangyong
zhangyong

保存退出::wq
4. 回到Hadoop目录/opt/module/hadoop-3.1.2
5. 执行程序

[zpark@hadoop104 hadoop-3.1.2]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.2.jar wordcount wcinput wcoutput
  1. 查看结果
[zpark@hadoop104 hadoop-3.1.2]$ cat wcoutput/part-r-00000
zhangyong 2
hadoop  2
mapreduce       1
yarn    1

在这里插入图片描述

6.2伪分布式运行模式

6.2.1 启动HDFS并运行MapReduce程序

  1. 分析
    (1)配置集群
    (2)启动、测试集群增、删、查
    (3)执行WordCount案例
  2. 执行步骤
    (1)配置集群
    (a)配置:hadoop-env.sh
    Linux系统中获取JDK的安装路径:
[zpark@hadoop104 ~]# echo $JAVA_HOME
/opt/module/jdk1.8.0_181

修改JAVA_HOME 路径:

export JAVA_HOME=/opt/module/jdk1.8.0_181

(b)配置:core-site.xml

<!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</name>
    <value>hdfs://hadoop104:9000</value>
</property>
<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
	<name>hadoop.tmp.dir</name>
	
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值