2021-09-12

第二章 Hadoop运行环境搭建

2.1 Hadoop环境搭建

  1. 确定有多台机器,机器之间网络互通
  2. 创建用户hadp,useradd hadp
  3. 创建目录,/opt下创建module software目录, 并且赋权限
  4. 拷贝安装包到software
    1. JDK ; tar -zxvf jdk-8u251-linux-x64.tar.gz -C ../module/  安装 ;配置PATH
    2. Hadoop  : 官网比较慢,腾讯地址 Index of /apache/hadoop/  解压;配置PATH
# set java
export JAVA_HOME=/opt/module/jdk1.8.0_251
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

# hadoop
export HADOOP_HOME=/opt/module/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

  5. hadoop的目录

2.2 Hadoop运行模式

2.1.1 本地(独立)模式

   官网案例 :  

[root@localhost hadoop-2.10.1]# mkdir input
[root@localhost hadoop-2.10.1]# cp etc/hadoop/*.xml input/
[root@localhost hadoop-2.10.1]# ./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.1.jar grep input output 'dfs[a-z.]+'
[root@localhost hadoop-2.10.1]# cat output/*
1       dfsadmin

# 注意事项output目录不能存在, 统计单词数量  

  例子二  wordcount

[root@localhost hadoop-2.10.1]# mkdir wcinput
[root@localhost hadoop-2.10.1]# cd wcinput/
[root@localhost hadoop-2.10.1]# touch wc.input
[root@localhost hadoop-2.10.1]# cat wcinput/wc.input
hadoop mapreduce
yarn
haha hello
hello
[root@localhost hadoop-2.10.1]#./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.1.jar wordcount wcinput wcoutput
[root@localhost hadoop-2.10.1]# cat wcoutput/*
hadoop  1
haha    1
hello   2
mapreduce       1
yarn    1

 
伪分布式模式
全分布式模式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值