Hadoop YARN完全分布式配置学习

最新推荐文章于 2022-06-25 16:19:02 发布

艾伦蓝

最新推荐文章于 2022-06-25 16:19:02 发布

阅读量184

点赞数

分类专栏： YARN Hadoop 文章标签：大数据运维 java

本文链接：https://blog.csdn.net/lan12334321234/article/details/88328363

版权

Hadoop 同时被 2 个专栏收录

82 篇文章 0 订阅

订阅专栏

YARN

5 篇文章 0 订阅

订阅专栏

[size=medium][color=red][b]版本及配置简介[/b][/color][/size]

Java:   JDK1.7.0_71
Hadoop: hadoop-2.5.2
Linux:  centos6.4 64bit

[color=red][b]暂且配置3台机器，假设三台机器IP如下：[/b][/color]

192.168.40.138 master
192.168.40.137 slave-1
192.168.40.136 slave-2

[size=medium][color=red][b]一.前置环境配置[/b][/color][/size]
[b]1.创建hadoop用户[/b]
以下操作使用root用户

$useradd -d /home/hadoop -s /bin/bash hadoop
$passwd hadoop
hadoop

[b]2.关闭防火墙（每台机器都需）[/b]

$chkconfig iptables off
关闭selinux
$vi /etc/selinux/config
SELINUX=disabled

[b]3.修改机器名[/b]

$vi /etc/sysconfig/network
将三台机器的名字分别改为master，slave-1,slave-2

[b]4.配置hosts文件[/b]

$vi /etc/hosts 追加
192.168.40.138 master
192.168.40.137 slave-1
192.168.40.136 slave-2

[b]5.重启机器[/b]

$reboot

[size=medium][color=red][b]3.配置SSH互信[/b][/color][/size]
[b]1.修改SSH配置文件[/b]

$vi /etc/ssh/sshd_config
找到下列行 去掉注释#
RSAAuthentication yes //字面意思..允许RSA认证 PubkeyAuthentication yes //允许公钥认证 
AuthorizedKeysFile .ssh/authorized_keys //公钥存放在.ssh/au..文件中

[b]2.重启SSH[/b]

$/etc/init.d/sshd restart

[b]3.切换至hadoop用户在master上进行如下操作[/b]

$ssh-keygen -t rsa

[b]在slave-1上操作[/b]

$ssh-keygen -t rsa
$scp /home/hadoop/.ssh/id_rsa.pub hadoop@master:~/.ssh/id_rsa.pub.slave-1

[b]在slave-2上操作[/b]

$ssh-keygen -t rsa
$scp /home/hadoop/.ssh/id_rsa.pub hadoop@master:~/.ssh/id_rsa.pub.slave-2

[b]在master上操作[/b]

$cat id_rsa.pub >> authorized_keys
$cat id_rsa.pub.slave-1 >> authorized_keys
$cat id_rsa.pub.slave-2 >> authorized_keys
$scp authorized_keys hadoop@slave-1:~/.ssh/
$scp authorized_keys hadoop@slave-2:~/.ssh/

[b]在每台机器上修改下面两个文件的权限：[/b]

$chmod 600 ~/.ssh/authorized_keys
$chmod 700 ~/.ssh/

[b]测试是否SSH互信配置好了：[/b]

$ssh master
$ssh slave-1
$ssh slave-2

[b]4.JDK安装[/b]
给集群每台机器安装JDK，并且设置好JAVA_HOME

$mkdir /usr/java
将jdk-7u71-linux-x64.tar上传到/usr/java目录并解压
$tar -xvf jdk-7u71-linux-x64.tar /usr/java
$rm -rf jdk-7u71-linux-x64.tar
$mv /usr/java/jdk1.7.0_71 /usr/java/jdk1.7

[color=red][b]设置JAVA_HOME[/b][/color]

$vi /etc/profile 追加下面文件
export JAVA_HOME=/usr/java/jdk1.7
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=.:$JAVA_HOME/bin:$PATH
$source /etc/profile
$java -version 检验JAVA环境变量是否设置好了

[size=large][color=red][b]二.hadoop安装[/b][/color][/size]
[b]1.解压并重命名hadoop[/b]
在master操作
将hadoop-2.5.2.tar 上传到/home/hadoop目录下并解压

$tar -xvf hadoop-2.5.2.tar
$rm -rf hadoop-2.5.2.tar

[b]2．创建hadoop需要的目录[/b]
创建如下文件夹(在每台节点创建)

mkdir -p /home/hadoop/tmp
mkdir -p /home/hadoop/dfs/name
mkdir -p /home/hadoop/dfs/data

[b]3．配置HADOOP_HOME[/b]

$vi /etc/profile 添加
export HADOOP_HOME=/home/hadoop/hadoop-2.5.2/
export PATH=$PATH:$HADOOP_HOME/bin

[b]4.编辑slaves[/b]

vi /home/hadoop/hadoop-2.5.2/etc/hadoop/slaves
#添加如下内容
slave-1
slave-2

[b]5.给hadoop指定JAVA_HOME[/b]

vi hadoop_env.sh
找到JAVA_HOME 设值为/usr/java/jdk1.7

[b]6.修改hadoop配置文件[/b]
[color=red][b]1).修改core-site.xml[/b][/color]
$vi /home/hadoop/hadoop-2.5.2/etc/hadoop/core-site.xml

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://master:9000</value>
  </property>
  <property>
    <name>io.file.buffer.size</name>
    <value>131072</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>file:/home/hadoop/tmp</value>
    <description>Abase for other temporary   directories.</description>
  </property>
  <property>
    <name>hadoop.proxyuser.hadoop.hosts</name>
    <value>*</value>
  </property>
  <property>
    <name>hadoop.proxyuser.hadoop.groups</name>
    <value>*</value>
  </property>
</configuration>

[color=red][b]2).修改hdfs-site.xml[/b][/color]
$vi /home/hadoop/hadoop-2.5.2/etc/hadoop/hdfs-site.xml

<configuration>
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>master:9001</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>file:/home/hadoop/dfs/name</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/home/hadoop/dfs/data</value>
  </property>
  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
  <property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
  </property>
</configuration>

[b]3).修改mapred-site.xml[/b]
$mv mapred-site.xml.templete mapred-site.xml
$vi /home/hadoop/hadoop-2.5.2/etc/hadoop/mapred-site.xml

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
  </property>
</configuration>

[b]4).修改yarn-site.xml[/b]
$vi /home/hadoop/hadoop-2.5.2/etc/hadoop/yarn-site.xml

<configuration>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>
  </property>
  <property>
    <name>yarn.resourcemanager.address</name>
    <value>master:8032</value>
  </property>
  <property>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>master:8030</value>
  </property>
  <property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>master:8031</value>
  </property>
  <property>
    <name>yarn.resourcemanager.admin.address</name>
    <value>master:8033</value>
  </property>
  <property>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>master:8088</value>
  </property>
</configuration>

[size=medium][color=red][b]7.拷贝软件到其他节点[/b][/color][/size]

scp -r /home/hadoop/hadoop-2.5.2 slave-1:/home/hadoop/
scp -r /home/hadoop/hadoop-2.5.2 slave-2:/home/hadoop/
scp -r /home/hadoop/hadoop-2.5.2 slave-3:/home/hadoop/

[b]8.格式化hdfs文件系统[/b]

 $hdfs namenode –format

[size=medium][b]9.启动hadoop[/b][/size]

$/home/hadoop/hadoop-2.5.2/sbin/start-all.sh

[color=red][size=medium][b]10.检测master节点：有以下三个进程表示启动成功[/b][/size][/color]
[b]检测master节点：有以下三个进程表示启动成功[/b]

$jps
41837 SecondaryNameNode
41979 ResourceManager
41661 NameNode

[b]检测slave节点：有以下两个进程表示启动成功[/b]
[code="command"]$jps
# jps
4543 DataNode
4635 NodeManager[/code]

艾伦蓝

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop YARN完全分布式配置学习

设三台机器IP如下：[/b][/color][code="txt"]192.168.40.138 master192.168.40.137 slave-1192.168.40.136 slave-2[/code][size=medium][color=red][b]一.前置环境配置[/b][/color][/size][b]1.创建hadoop用户[/b]以下操作使用root用户[code="command"]$useradd -d /
复制链接

扫一扫