搭建Hadoop的环境-第三讲

最新推荐文章于 2024-04-20 16:41:53 发布

郝文龙

最新推荐文章于 2024-04-20 16:41:53 发布

阅读量343

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/a639735331/article/details/79008179

版权

hadoop 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

准备实验的环境：
1、安装Linux、JDK
2、配置主机名、免密码登录参考博客:http://blog.csdn.net/a639735331/article/details/79229826
3、约定：安装目录：/root/training

安装：
1、解压 : tar -zxvf hadoop-2.4.1.tar.gz -C /root/training/
2、设置环境变量： vi ~/.bash_profile

HADOOP_HOME=/root/training/hadoop-2.4.1
export HADOOP_HOME
PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export  HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

生效环境变量： source ~/.bash_profile

第一节：Hadoop的目录结构

第二节：Hadoop的本地模式
1、特点：不具备HDFS，只能测试MapReduce程序
2、修改hadoop-env.sh 添加如下信息

export JAVA_HOME=/jdk/jdk1.7.0_55
export  HADOOP_HOME=/root/training/hadoop-2.4.1
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export  HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

3、演示Demo: $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar
命令：hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /root/data/input/data.txt /root/data/output/wc
日志：17/08/04 23:28:38 INFO mapreduce.Job: map 100% reduce 100%

注意：MR有一个默认的排序规则

第三节：Hadoop的伪分布模式

1、特点：具备Hadoop的所有功能，在单机上模拟一个分布式的环境

（1）HDFS：主：NameNode，数据节点：DataNode
（2）Yarn：容器，运行MapReduce程序
主节点：ResourceManager
从节点：NodeManager

2、步骤：
（1）hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>1</value>
</property>


<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

（2）core-site.xml

<property>
<name>fs.defaultFS</name>
<value>hdfs://192.168.88.11:9000</value>
</property>


<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-2.4.1/tmp</value>
</property>

(3) mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

(4) yarn-site.xml

<!--配置ResourceManager的地址-->  
<property>  
  <name>yarn.resourcemanager.hostname</name>  
  <value>192.168.88.11</value>  
</property>  


<!--配置NodeManager执行任务的方式-->  
<property>  
  <name>yarn.nodemanager.aux-services</name>  
  <value>mapreduce_shuffle</value>  
</property>
<!--其他-->
<property>  
  <name>yarn.resourcemanager.address</name>  
  <value>127.0.0.1:8032</value>  
</property>  
<property>  
  <name>yarn.resourcemanager.scheduler.address</name>  
  <value>127.0.0.1:8030</value>  
</property>  
<property>  
  <name>yarn.resourcemanager.resource-tracker.address</name>  
  <value>127.0.0.1:8031</value>  
</property>

(5)修改hadoop-env.sh (如果第2小节中已经修改忽略此步奏)

export JAVA_HOME=/jdk/jdk1.7.0_55

export HADOOP_HOME=/root/training/hadoop-2.4.1
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

(6) 格式化NameNode

hdfs namenode -format
日志：Storage directory /root/training/hadoop-2.4.1/tmp/dfs/name has been successfully formatted.

(7) 启动：start-all.sh
(*) HDFS: 存储数据

(*) Yarn：执行计算

(8)验证是否启动成功输入命令jps

(8) 访问：

（*）命令行

（*）Java API
（*）Web Console：
HDFS：http://192.168.88.11:50070

Yarn：http://192.168.88.11:8088

安装完成后遇到问题参考博客 : http://blog.csdn.net/a639735331/article/details/79238649

郝文龙

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
搭建Hadoop的环境-第三讲

准备实验的环境：1、安装Linux、JDK2、配置主机名、免密码登录参考博客:http://blog.csdn.net/a639735331/article/details/792298263、约定：安装目录：/root/training安装：1、解压 : tar -zxvf hadoop-2.4.1.tar.gz -C /root/training/2、设置
复制链接

扫一扫