四、Linux环境下JDK安装、Hadoop、Zookeeper和HBase集群部署

目的:我要在我的三台虚拟机(Server01、Server02、Server03)上进行Linux环境下JDK安装。

前提:先登录打开虚拟机,通过XShell进行连接,下载好Xftp工具来操作。

XShell:与我们VMware Workstation Pro的虚拟机连接后,可以实现复制粘贴,而且界面更加好看。

Xftp:可以将我们自己电脑上面的压缩包,通过它添加到我们的虚拟机中,起到一个桥梁的作用。

(一)Linux环境下JDK安装

1.在Xftp新建一个会话

2.将压缩包传入虚拟机(资料如下)

百度网盘:

链接:https://pan.baidu.com/s/1ceN110N6mMk4eNR5Tk4xwA?pwd=aj93 
提取码:aj93

3.验证

传输完成后,我们回到XShell的Server01界面,到/opt/目录下看看我的的压缩包是否传输成功

4.解压文件:

输入tar -zxvf jdk......(按Tab建自动补全)

5.编辑系统环境变量配置文件

输入命令vi /etc/profile,通过方向键光标移到最底下,按o进入编辑模式复制下面代码到里面。

export JAVA_HOME=/opt/jdk1.8.0_311
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

粘贴后,按esc键,“:”+“wq”,保存并退出。

6.生效环境变量

需要在所有服务器执行

source /etc/profile

7.查看是否安装配置成功,查看java版本:

java -version

(二)Hadoop集群部署

前提:已利用Xftp工具将压缩包传至虚拟机的/opt/中。

(先在Server01的XShell界面上进行安装Hadooop环境,Hadoop集群配置,将这些操作步骤完成后,通过已经配置好的ssh免密,使Server02和Server03快速地完成Hadoop集群部署)

##安装Hadooop环境

(当前在Server01的XShell界面)

1.解压文件

tar -zxvf hadoop版本.tar.gz

2.编辑系统环境变量配置文件

vi /etc/profile
export HADOOP_HOME=/opt/hadoop-3.1.3
export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

3.生效环境变量

需要在所有服务器执行

source /etc/profile

4.查看是否安装配置成功,查看Hadoop版本

hadoop version

##Hadoop集群配置

(当前在Server01的XShell界面)

1. 配置Hadoop集群主节点

① 进入Hadoop配置文件文档

cd /opt/hadoop-3.1.3/etc/hadoop/

② 修改hadoop-env.sh文件

vi hadoop-env.sh

随便找一个前面没有#的地方,按i,黏贴下面内容:

export JAVA_HOME=/opt/jdk1.8.0_311

esc键,冒号加wq退出

③ 修改core-site.xml文件

vi core-site.xml

按i进入编辑模式粘贴下面代码:

<!-- 用于设置Hadoop的文件系统,由URI指定 -->
<configuration>
<!-- 用于设置Hadoop的文件系统,由URI指定 -->
<property>
<!-- 用于指定namenode地址在主节点机器上 -->
<name>fs.defaultFS</name>
<value>hdfs://Server01:9000</value>
</property>
<!-- 配置Hadoop的临时目录,默认/tmp/hadoop-${user.name} -->
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-3.1.3/tmp</value>
</property>
</configuration>

esc+:+wq保存退出

④ 修改hdfs-site.xml文件

vi hdfs-site.xml

在编辑前删除最后两行,按o后粘贴,按esc+:+wq

<configuration>
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<!-- secondary namenodes所在主机的IP和端口 -->
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>Server02:50090</value>
</property>
</configuration>

⑤ 修改mapred-site.xml文件

vi mapred-site.xml

在编辑前删除最后两行,按o后粘贴,按esc+:+wq

<configuration>
<!-- 指定MapReduce运行时框架,这里指定在YARN上,默认时local -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

⑥ 修改yarn-site.xml文件

vi yarn-site.xml

在编辑前删除最后三行,按o后粘贴,按esc+:+wq

<configuration>
<!-- 指定YARN集群的管理者(ResourceManager)的地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>Server01</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

⑦ 修改slaves文件

vi workers

删除localhost,如果没有他就直接添加以下内容:

下面的这个不是固定的,这三个是我三个虚拟机的名字,按照需要设置。

Server01
Server02
Server03

因为我们是用root登录的,所以我们需要进行以下操作:

cd /opt/hadoop-3.1.3/sbin/

vi start-dfs.sh

找一行没有#的,按o把下面的代码粘贴进去,按esc键+:+wq

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

vi stop-dfs.sh

找一行没有#的,按o把下面的代码粘贴进去,按esc键+:+wq

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

vi start-yarn.sh

找一行没有#的,按o把下面的代码粘贴进去,按esc键+:+wq

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

vi stop-yarn.sh

找一行没有#的,按o把下面的代码粘贴进去,按esc键+:+wq

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

2.分发文件

将集群主节点的配置文件分发到其他子节点

基于ssh免密已经设置好的情况下,我们在Server01的界面执行:

 scp /etc/profile Server02:/etc/profile
 scp /etc/profile Server03:/etc/profile
 scp -r /opt/jdk1.8.0_311 Server02:/opt/
 scp -r /opt/jdk1.8.0_311 Server03:/opt/
 scp -r /opt/hadoop-3.1.3 Server02:/opt
scp -r /opt/hadoop-3.1.3 Server03:/opt/

文件下发到Server02、Server03后,我们可以cd  /opt/后ls

看看文件是否存在

生效环境变量,在三台虚拟机上执行命令

source /etc/profile

##Hadoop集群测试

(当前在Server01的XShell界面)

cd /opt/

1.格式化文件系统

首次使用需要格式化文件系统

hadoop namenode -format

2.启动和关闭Hadoop集群

start-all.sh

3.查看是否启动,在三台虚拟机上执行命令,进行观察

jps

到此我们的Hadoop的配置已全部完成。

(三)Zookeeper部署

1. 上传并解压HBase安装包

cd /opt/
tar -zxvf apache-zookeeper-3.5.9-bin.tar.gz

2.修改Zookeeper的配置文件

cd /opt/apache-zookeeper-3.5.9-bin/conf/
cp zoo_sample.cfg zoo.cfg
vi zoo.cfg

3.修改环境变量

vi /etc/profile

4.分发文件

scp /etc/profile Server02:/etc/profile
scp /etc/profile Server03:/etc/profile
scp -r /opt/apache-zookeeper-3.5.9-bin Server02:/opt/
scp -r /opt/apache-zookeeper-3.5.9-bin Server03:/opt/

5.创建myid文件

cd /opt/apache-zookeeper-3.5.9-bin
mkdir zkdata
cd zkdata/
vi myid

6.生效环境变量

需要在所有服务器执行

source /etc/profile

7.启动Zookeeper服务

需要在所有服务器启动

zkServer.sh start

查看该节点服务器情况

zkServer.sh status

8.查看是否启动,在三台虚拟机上执行命令,进行观察

jps

(四)HBase集群部署

前提:已利用Xftp工具将压缩包传至虚拟机的/opt/中。

(先在Server01的XShell界面上完成HBase集群部署,再通过已经配置好的ssh免密,快速实现多台虚拟机的HBase集群部署)

1. 上传并解压HBase安装包

(当前在Server01的XShell界面)

cd /opt/
tar -zxvf hbase-2.2.2-bin.tar.gz

2.复制文件

cp /opt/hadoop-3.1.3/etc/hadoop/{hdfs-site.xml,core-site.xml} /opt/hbase-2.2.2/conf/

3.配置相关文件

① 修改hbase-ev.sh文件:

vi /opt/hbase-2.2.2/conf/hbase-env.sh

找一行没有#的(如第一行后面),按o把下面的代码粘贴进去,按esc键+:+wq

下面代码的配置一定要和之前的相对应

export JAVA_HOME=/opt/jdk1.8.0_311
export HBASE_MANAGES_ZK=false

② 修改hbase-site.xml文件:

vi /opt/hbase-2.2.2/conf/hbase-site.xml

在最后两行按dd,删除,然后,按o,粘贴下面内容,按esc+:+wq,保存退出(下面的必须和Hadoop配置的一样)

<configuration>
<!-- 指定hbase在HDFS上存储的路径 -->
<property>
<name>hbase.rootdir</name>
<value>hdfs://Server01:9000/hbase</value>
</property>
<!-- 指定hbase是分布式的 -->
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<!-- 指定zk的地址,多个用逗号分隔 -->
<property>
<name>hbase.zookeeper.quorum</name>
<value>Server01:2181</value>
</property>
</configuration>

③ 修改regionservers文件:

vi /opt/hbase-2.2.2/conf/regionservers

删除localhost,添加以下内容: Server02 Server03

④ 新增ackup-masters文件:

vi /opt/hbase-2.2.2/conf/backup-masters

添加Server02

4.修改环境变量

vi /etc/profile

光标移到最后,添加下面代码

export HBASE_HOME=/opt/hbase-2.2.2
export PATH=$PATH:$HBASE_HOME/bin

5.分发文件

基于ssh免密已经设置好的情况下,我们在Server01的界面执行:

scp /etc/profile Server02:/etc/profile
scp /etc/profile Server03:/etc/profile

scp -r /opt/hbase-2.2.2 Server02:/opt/
scp -r /opt/hbase-2.2.2 Server03:/opt/

6.生效环境变量

需要在所有服务器执行

source /etc/profile

7.启动HBase集群

(前提:Hadoop已经启动)

start-hbase.sh

8.查看是否启动,在三台虚拟机上执行命令,进行观察

jps

是否看见HMaster和HRegionServer进程 通过http://Hadoop01:16010,查看HBase集群状态。

如果和上面一样那么恭喜你成功配置好了!!!

如果只有Server01出现HMaster,而Server02、Server03没有HRegionServer可能是集群时间不同步导致的:

我们输入date查看三台虚拟机时间

①可以通过timedatectl set-time  "2024-03-10 23:50:00"手动设置了虚拟机的时间,(每台都要)再次jps查看就可以看见HMaster和HRegionServer进程了。

②也可以在每一台虚拟机,点击设置

(五)HBase Shell验证组件是否安装配置成功

1.启动hadoop集群:

start-all.sh

2.启动Zookeeper服务:

zkServer.sh start

zkServer.sh status

3.启动hbase集群

start-hbase.sh

4.输入hbase shell

输入list

出现以下信息则没有问题。

如果HBase报错ERROR: KeeperErrorCode = NoNode for /hbase/master:

可以参考文章:地址

1.

vi /opt/hbase-2.2.2/conf/hbase-env.sh
export HBASE_DISABLE_HADOOP_CLASSPATH_LOOKUP="true"

2.

vi /opt/hbase-2.2.2/conf/regionservers

增加Server01

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值