1、虚拟机和组件的获取和选择
1.1、虚拟机
参数 | 值 | 说明 |
---|---|---|
虚拟机名称 | namenode,datanode1,datanode2 | 19.168.229.[100/101/102] |
虚拟机个数 | 3台 | 个数最少3个,且最好为奇数 |
内存 | 20G/4G | 主节点20G子节点4G |
磁盘 | 300G | 三台相同 |
系统 | CentOS-7-x86_64-DVD-1708.iso | 三台相同 |
之前搭建CDH,因此沿用它的配置。
1.2、版本选择
系统
CentOS-7-x86_64-DVD-1708.iso
jdk
jdk-8u152-linux-x64.tar.gz
hadoop
hadoop-2.7.7.tar.gz
zookeeper
zookeeper-3.4.14.tar.gz
1.3 、架包下载
系统下载地址:http://mirrors.163.com/centos/7/isos/x86_64/
jdk下载地址:https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html
hadoop下载地址:https://archive.apache.org/dist/hadoop/common/
zookeeper下载地址:https://mirrors.bfsu.edu.cn/apache/zookeeper/
2、配置基础环境
2.1、虚拟机IP配置
输入如下命令,开始配置ip
vi /etc/sysconfig/netwok-scripts/ifcfg-*
进入文件后配置静态IP添加或者修改配置如下
添加配置参数
IPADDR=192.168.229.100/101/102
NETMASK=255.255.255.0
GATEWAY=192.168.229.2
DNS1=114.114.114.114
上面的配置是添加的ip地址,子网掩码,网关和DNS
修改配置参数
ONBOOT=yes
BOOTPROTO=static
机器重启生效和 机器IP地址获取方式由动态变为静态 static=>> dhcp
重启network
service network restart
检测是否能ping通其他内网机器,若无法ping通,查看ESXI配置,是否是桥接模式且宿主机器网络是否联通。
2.2、配置hostname
执行如下操作修改主机名称
vi /etc/hostname 或者
vi /etc/sysconfig/network
填写想要设定的主机名称即可,查看主机名称
hostname
2.3、配置hosts
配置hosts的目的在于CDH能够通过主机名称或者别名登陆其他机器。
vi /etc/hosts
我的配置如下
192.168.229.100 namenode
192.168.229.101 datanode1
192.168.229.102 datanode2
2.4、禁用防火墙
CDH运行过程中,可能会因为防火墙的原因,会有特殊的问题,建议关闭防火墙,如果不能关闭,那需要逐条配置端口规则。
systemctl stop firewalld
systemctl disable firewalld
上面两步依次是检查是否安装了mariadb和卸载mariadb
2.5、禁用SELinux功能
首先查看 SELinux功能是否开启。
getenforce
如果显示Permissive 或者 Disabled 该步骤直接跳过,如果是enforcing ,进行下一步
vi /etc/selinux/config
将SELINUX=enforcing改为 SELINUX= disabled或者在外面输入
sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
2.6、创建个人用户
2.6.1、创建用户并修改密码
useradd wangkkai
passwd wangkai
2.6.2、配置用户权限
chmod 777 /etc/sudoers
vi /etc/sudoers
如下图添加
chmod 440 /etc/sudoers
2.6、免密登陆
在主节点上运行
ssh-keygen -t rsa
回车三次 生成一个秘钥
分发到所有节点
ssh-copy-id ip(需要分发节点的具体ip)
输入该节点的密码即可成功
验证:ssh root@节点名称 登陆成功不输入密码代表配置成功
(注:配置的第一个节点以后在配置第二个节点时不用再生成密钥,直接分发即可)
3、安装jdk
3.1、jdk选择
目前来看,jdk8版本的在网上的参考资料先对来说挺多的,而且java作为其他组件的依赖基础,选择8版本的挺好的。
因此我选择jdk-8u152-linux-x64.tar.gz
3.2、创建目录
我这里方便以后进行集群的搭建,统一/opt/software放组件的架包,/opt/module放解压文件。
mkdir -p /opt/module
mkdir -p /opt/software
3.3、解压 JDK
把下载的文件 jdk-8u152-linux-x64.tar.gz 放在/opt/software目录下然后进行解压。
tar -zxf /opt/software/jdk-8u152-linux-x64.tar.gz -C /opt/module/
3.4、设置环境变量
vi /etc/profile
在 profile 文件中添加如下内容并保存:
# JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_152
export PATH=$PATH:$JAVA_HOME/bin
注意:其中 JAVA_HOME 请根据自己的实际安装路径及 JDK 版本配置进行配置。
让配置生效:
source /etc/profile
3.5、检测
输入java -version
显示 java 版本信息,则说明 JDK 安装成功。
4、安装zookeeper
4.1、解压软件zookeeper
tar -zxf /opt/software/zookeeper-3.4.14.tar.gz -C /opt/module/
4.2、配置环境变量
# ZOOKEEPER_HOME
export ZOOKEEPER_HOME=/opt/module/zookeeper-3.4.14
export PATH=$PATH:$ZOOKEEPER_HOME/bin
4.3、进入zookeeper的解压文件后执行如下操作
cp /opt/module/zookeeper-3.4.14/conf/zoo_sample.cfg /opt/module/zookeeper-3.4.14/conf/zoo.cfg
sudo vi /opt/module/zookeeper-3.4.14/conf/zoo.cfg
tickTime=2000
clientPort=2181
initLimit=5
syncLimit=2
dataDir=/opt/module/zookeeper-3.4.14/data
dataLogDir=/opt/module/zookeeper-3.4.14/logs
server.0=192.168.229.100:2888:3888
server.1=192.168.229.101:2888:3888
server.2=192.168.229.102:2888:3888
• initLimit
ZooKeeper集群模式下包含多个zk进程,其中一个进程为leader,余下的进程为follower。
当follower最初与leader建立连接时,它们之间会传输相当多的数据,尤其是follower的数据落后leader很多。initLimit配置follower与leader之间建立连接后进行同步的最长时间。
• syncLimit
配置follower和leader之间发送消息,请求和应答的最大时间长度。
• tickTime
tickTime则是上述两个超时配置的基本单位,例如对于initLimit,其配置值为5,说明其超时时间为 2000ms * 5 = 10秒。
• clientPort
clientPort这个端口就是客户端(应用程序)连接Zookeeper服务器的端口,Zookeeper会监听这个端口接受客户端的访问请求。
• server.A=B:C:D
A是一个数字,表示这个是第几号服务器;
B是这个服务器的IP地址(或者是与IP地址做了映射的主机名);
C第一个端口用来集群成员的信息交换,表示这个服务器与集群中的Leader服务器交换信息的端口;
D是在leader挂掉时专门用来进行选举leader所用的端口。
注意:如果是伪集群的配置方式,不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。
4.4、创建myid文件
在dataDir=/opt/module/zookeeper-3.4.14/data这个文件下创建myid文件。执行如下操作。
touch myid
echo 0 > myid
【注】每一个节点对应的数字依次增加即可。
5、安装hadoop
5.1 hadoop集群的节点服务
节点 | NN | DN | ZK | ZKFC | JN | RM | NM |
---|---|---|---|---|---|---|---|
namenode | √ | √ | √ | √ | √ | √ | √ |
datanode1 | √ | √ | √ | √ | √ | √ | √ |
datanode2 | √ | √ | √ | √ |
HA的NN和RM可以多个配置,最小两个,官方建议不要超过5个。
HDFS-HA架构图:
YARN HA 架构图:
5.1 开始安装
5.1.1、文件解压
tar -zxf /opt/software/hadoop-3.1.3.tar.gz -C /opt/module/
5.1.2、配置环境变量
sudo vi /etc/profile
# HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.7.7
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
刷新配置文件让配置生效
source /etc/profile
为了方便文件的传递。我们写一个脚本xsynsc。
关于复制指令scp和rsync对比。
rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。
开始编写
在/root/文件夹下执行如下内容。
mkdir bin
cd bin/
touch xsync
vi xsync
脚本内容
#!/bin/bash
#1 获取输入参数个数,如果没有参数,直接退出
pcount=$#
if ((pcount==0)); then
echo no args;
exit;
fi
#2 获取文件名称
p1=$1
fname=`basename $p1`
echo fname=$fname
#3 获取上级目录到绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir
#4 获取当前用户名称
user=`whoami`
#5 循环
for((host=1; host<3; host++)); do
echo ------------------- datanode$host --------------
rsync -av $pdir/$fname $user@datanode$host:$pdir
done
保存后,修改权限并传输到各个节点。
chmod 777 xsync
xsync /home/wangkai/bin
5.2、修改配置文件
配置文件core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml和yarn-site.xml 共5个文件。
5.2.1、hadoop-env.sh
将JAVA_HOME后填写路径。
export JAVA_HOME=/opt/module/jdk1.8.0_152
5.2.2、core-site.xml
<configuration>
<property>
<name>hadoop.native.lib</name>
<value>false</value>
</property>
<property>
<name>hadoop.proxyuser.root.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.root.groups</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.wangkai.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.wangkai.groups</name>
<value>*</value>
</property>
<property>
<name>fs.trash.interval</name>
<value>1440</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/module/hadoop-2.7.7/data/tmp</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/module/hadoop-2.7.7/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/module/hadoop-2.7.7/dfs/data</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>namenode:2181,datanode1:2181,datanode2:2181</value>
</property>
</configuration>
5.2.3、hdfs-site.xml
<configuration>
<property>
<name>dfs.nameservices</name>
<value>cluster1</value>
</property>
<property>
<name>dfs.ha.namenodes.cluster1</name>
<value>nn,dn1</value>
</property>
<property>
<name>dfs.namenode.rpc-address.cluster1.nn</name>
<value>namenode:9820</value>
</property>
<property>
<name>dfs.namenode.rpc-address.cluster1.dn1</name>
<value>datanode1:9820</value>
</property>
<property>
<name>dfs.namenode.http-address.cluster1.nn</name>
<value>namenode:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.cluster1.dn1</name>
<value>datanode1:50070</value>
</property>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://namenode:8485;datanode1:8485;datanode2:8485/cluster1</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/opt/module/hadoop-2.7.7/dfs/journal</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.cluster1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/wangkai/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.journalnode.http-address</name>
<value>0.0.0.0:8480</value>
</property>
<property>
<name>dfs.journalnode.rpc-address</name>
<value>0.0.0.0:8485</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>namenode:2181,datanode1:2181,datanode2:2181</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.namenode.acls.enabled</name>
<value>true</value>
</property>
</configuration>
5.2.4、mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>0.0.0.0:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>namenode:19888</value>
</property>
<property>
<name>yarn.app.mapreduce.am.resource.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.map.java.opts</name>
<value>-Xmx512M</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.reduce.java.opts</name>
<value>-Xmx512M</value>
</property>
<property>
<name>mapred.child.java.opts</name>
<value>-Xmx512M</value>
</property>
</configuration>
5.2.5、yarn-site.xml
<configuration>
<property>
<name>yarn.resourcemanager.connect.retry-interval.ms</name>
<value>2000</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>namenode:2181,datanode1:2181,datanode2:2181</value>
</property>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>namenode</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>datanode1</value>
</property>
<property>
<name>yarn.resourcemanager.ha.id</name>
<value>rm1</value>
</property>
<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.zk-state-store.address</name>
<value>namenode:2181,datanode1:2181,datanode1:2181</value>
</property>
<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>namenode:2181,datanode1:2181,datanode2:2181</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster1</value>
</property>
<property>
<name>yarn.app.mapreduce.am.scheduler.connection.wait.interval-ms</name>
<value>5000</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm1</name>
<value>namenode:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm1</name>
<value>namenode:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm1</name>
<value>namenode:8088</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm1</name>
<value>namenode:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm1</name>
<value>namenode:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm1</name>
<value>namenode:23142</value>
</property>
<property>
<name>yarn.resourcemanager.address.rm2</name>
<value>datanode1:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address.rm2</name>
<value>datanode1:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address.rm2</name>
<value>datanode1:8088</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address.rm2</name>
<value>datanode1:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address.rm2</name>
<value>datanode1:8033</value>
</property>
<property>
<name>yarn.resourcemanager.ha.admin.address.rm2</name>
<value>datanode1:23142</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/opt/module/hadoop-2.7.7/data/nm</value>
</property>
<property>
<name>yarn.nodemanager.log-dirs</name>
<value>/opt/module/hadoop-2.7.7/log/yarn</value>
</property>
<property>
<name>mapreduce.shuffle.port</name>
<value>23080</value>
</property>
<property>
<name>yarn.client.failover-proxy-provider</name>
<value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value>
</property>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.zk-base-path</name>
<value>/yarn-leader-election</value>
</property>
<property>
<name>yarn.nodemanager.vcores-pcores-ratio</name>
<value>1</value>
</property>
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4.2</value>
</property>
<property>
<name>yarn.nodemanager.resource.detect-hardware-capabilities</name>
<value>true</value>
</property>
</configuration>
5.2.6、slaves
将作为datanode的节点的节点名称写入其中
namenode
datanode1
datanode2
上面的配置文件配置好后进行分发到各个节点上。
6、启动hadoop集群
hadoop高可用需要每个节点开启zookeeper
/opt/module/zookeeper-3.4.14/zkServer.sh start
在其中一个namenode(假设在namenode节点上)上格式化zookeeper
hdfs zkfc -formatZK
启动journalnode,需要启动所有节点的journalnode
./sbin/hadoop-daemon.sh start journalnode
在其中一个namenode(在namenode节点上)上格式化namenode
hdfs namenode -format
另外一个namnode进行同步。
hdfs namenode -bootstrapStandby
#如果这一步失败,那就启动namenode机器的namenode,在进行这一步。
以上则配置完成。
./sbin/start-all.shn
开启所有服务,
(1)假如出现2个standby状态的namenode,那么执行hdfs haadmin -transitionToActive -forcemanual nn
强制转换一个namenode。
(2)第2个RM需要./sbin/yarn-daemon.sh start resourcemanager
进行开启。
(3)开启历史服务mapred --daemon start historyserver
6、验证hadoop集群
创建wc.input文件并上传到Hadoop上(hadoop fs -put wc.input /
)查看http:ip:50070,如下图,hdfs成功。
输入hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.0.jar wordcount /wc.input /wc.output
)查看http:ip:8088,如下图,yarn成功。
各个jps后的截图
namenode
datanode1
datanode2
本文内容为个人理解,如有错误,还请指出。