搭建的硬件环境:centos7
需要下载的文件:jdk1.8、zookeeper-3.4.14、hadoop-2.8.5、hbase-2.1.6
下载地址:
jdk1.8 https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
zookeeper-3.4.14.tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.4.14/
hadoop-2.8.5.tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.8.5/
hbase-2.1.6-bin.tar.gz https://archive.apache.org/dist/hbase/2.1.6/
文件统一放在 /opt/modules下面
1、安装jdk1.8
解压文件:
cd /opt/modules
tar -zxvf jdk-8u221-linux-x64.tar.gz
配置环境变量:
打开环境配置文件
vim /etc/profile
增加如下内容:
export JAVA_HOME=/opt/modules/jdk1.8.0_221
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH
export JAVA_PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin
export PATH=$PATH:${JAVA_PATH}
重新加载系统配置文件
source /etc/profile
检查jdk 是否安装成功
java -version 返回jdk 版本
javac
2、zookeeper-3.4.14安装
解压文件:
cd /opt/modules
tar -zxvf zookeeper-3.4.14.tar.gz
进入目录,创建data文件夹
cd zookeeper-3.4.14
mkdir zkData
创建数据目录和日志目录
cd zkData
mkdir data
mkdir logs
进入conf文件夹进行配置
cd conf
将zoo_sample.cfg复制一份并重命名为zoo.cfg
cp zoo_sample.cfg zoo.cfg
修改zoo.cfg中dataDir路径为刚刚创建的data,并增加日志目录
dataDir=/opt/modules/zookeeper-3.4.14/zkData/data
dataLogDir=/opt/modules/zookeeper-3.4.14/zkData/logs
集群环境配置
修改zoo.cfg文件,在文件末尾追加(由于1台机器,按照:server.n=域名:2888:3888格式)
server.1=test:2888:3888
增加myid文件
cd zkData
touch myid
vi myid
因为我们上面定义的是server.1,所以这里是写1,如果多台机器,依次向下填写:
启动服务器上的Zookeeper
/opt/modules/zookeeper-3.4.14/bin/zkServer.sh start
启动完成:
3、hadoop-2.8.5安装
解压文件:
cd /opt/modules
tar -zxvf hadoop-2.8.5.tar.gz
配置环境变量
打开环境配置文件
vim /etc/profile
文件追加:
export HADOOP_HOME=/opt/modules/hadoop-2.8.5
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
重新加载系统配置文件
source /etc/profile
查看版本:
hadoop version
新增tmp文件夹:
cd /opt/modules/hadoop-2.8.5/data
mkdir tmp
修改配置文件:
进入hadoop/etc目录
cd /opt/modules/hadoop-2.8.5/etc/hadoop
修改hadoop-env.sh
vim hadoop-env.sh
修改如下参数:
jdk安装路径
export JAVA_HOME=/opt/modules/jdk1.8.0_221
修改core-site.xml 集群全局参数
vim core-site.xml
添加如下参数:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://test:9000/hbase</value> //配置HDFS地址,域名:9000
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.8.5/data/tmp</value> //临时文件夹
</property>
</configuration>
修改hdfs-site.xml HDFS参数
vim hdfs-site.xml
添加如下参数:
<configuration>
<property>
<name>dfs.replication</name> //副本数
<value>1</value>
</property>
<property>
<name>dfs.permissions.enabled</name> //权限
<value>false</value>
</property>
</configuration>
启动及验证
格式化hdfs:
/opt/modules/hadoop-2.8.5/bin/hdfs namenode -format
初始化命名空间:
/opt/modules/hadoop-2.8.5/sbin/hadoop-daemon.sh start namenode
初始化数据节点:
/opt/modules/hadoop-2.8.5/sbin/hadoop-daemon.sh start datanode
浏览器输入:
http://192.168.72.129:50070
4、安装hbase-2.1.6
解压文件:
cd /opt/modules
tar -zxvf hbase-2.1.6-bin.tar.gz
修改hbase配置文件
进入conf文件夹
cd hbase-2.1.6/conf
修改hbase-env.sh
vim hbase-env.sh
修改如下参数:
jdk的启动参数配置,以及垃圾收集器的选择,
export HBASE_OPTS="$HBASE_OPTS -verbose:gc -Xloggc:$HBASE_LOG_DIR/hbase.gc.log -XX:ErrorFile=$HBASE_LOG_DIR/hs_err_pid.log -XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:CMSInitiatingOccupancyFraction=70"
采用自己配置的zookeeper,设置false:
export HBASE_MANAGES_ZK=false
修改hbase-site.xml
vim hbase-site.xml
添加如下参数:
<configuration>
<property>
<name>hbase.tmp.dir</name>
<value>/opt/modules/hbase-2.1.6/data/tmp</value> //临时文件夹
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://test:9000/hbase</value> //hdfs目录
</property>
<property>
<name>hbase.cluster.distributed</name> //采用分布式部署
<value>true</value>
</property>
<property>
<name>hbase.master</name> //分布式主节点
<value>test:16000</value>
</property>
<property>
<name>dfs.replication</name> //副本数
<value>1</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name> //zookeeper地址
<value>test</value>
</property>
</configuration>
启动Hbase:
/opt/modules/hbase-2.1.6/bin/start-hbase.sh
浏览器输入:
http://192.168.72.129:16010