完整Hadoop+Spark+Zookeeper+Hbase+HIve+Pig+Mysql+Sqoop集群配置文件记录

最新推荐文章于 2022-08-28 06:42:24 发布

大鱼-瓶邪

最新推荐文章于 2022-08-28 06:42:24 发布

阅读量3.1k

点赞数 1

分类专栏： Hadoop

本文链接：https://blog.csdn.net/qq_25948717/article/details/81227573

版权

Hadoop 专栏收录该内容

58 篇文章 7 订阅

订阅专栏

目录结构说明：整个集群采用node63 node64 node65 node66 node67 node69 node70节点 **Hadoop：**node63作为namenode，node64作为secondarynamenode，node65,node66 node67
node68 node69 node70作为datanode
**Zookeeper：**node63 node64 node65 node66 node67 node69 node70都有部署，一般node66作
为 leader
**Hbase：**node63 node64 node65 node66 node67 node69 node70都有部署，一般选取node63作
为HMaster,node64作为备用的。
HIve：node63作为HIve服务端，node70作为客户端
**Pig：**node63
**Spark：**node63 node64 node65 node66 node67 node69 node70都有部署
**Mysql：**node63，node64，选取node63作为本地策略
**Sqoop：**node63

node63目录截图：
这里写图片描述
node70目录截图：

node64-node69截图：

关闭个节点的防火墙。
各个节点的/etc/profile配置截图：
export JAVA_HOME=/usr/local/jdk1.8.0_172 #这里路径为自己解压的JDK的路径
export CLASSPATH= ${JAVA_HOME}/lib export PATH=$ {JAVA_HOME}/bin: $PATH export HADOOP_HOME=/root/hadoop-2.8.4 export HADOOP_INSTALL=$ HADOOP_HOME
export HADOOP_MAPRED_HOME= $HADOOP_HOME export HADOOP_COMMON_HOME=$ HADOOP_HOME
export HADOOP_HDFS_HOME= $HADOOP_HOME export YARN_HOME=$ HADOOP_HOME
export HADOOP_CONF_DIR= $HADOOP_HOME/etc/hadoop export YARN_CONF_DIR=$ HADOOP_HOME/etc/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR= $HADOOP_HOME/lib/native export PATH=$ PATH: $HADOOP_HOME/sbin:$ HADOOP_HOME/bin
export ZOOKEEPER_HOME=/root/zookeeper-3.4.12
export PATH= $PATH:$ ZOOKEEPER_HOME/bin
export HBASE_HOME=/root/hbase-2.0.0
export PATH= $PATH:$ HBASE_HOME/bin
export SCALA_HOME=/root/scala
export PATH= $PATH:$ SCALA_HOME/bin
export SPARK_HOME=/root/spark
export PATH= $PATH:$ SPARK_HOME/bin
export HIVE_HOME=/root/hive2
export HIVE_CONF_DIR=/root/hive2/conf
export PATH= $PATH:$ HIVE_HOME/bin
export PIG_HOME=/root/pig-0.16.0
export PIG_CLASSPATH= $HADOOP_HOME/etc/hadoop export PATH=$ PATH: $PIG_HOME/bin export SQOOP_HOME=/root/sqoop-hadoop export PATH=$ PATH:$SQOOP_HOME/bin
这里写图片描述

node63目录截图：
这里写图片描述
node70目录截图：

node64-node69截图：

关闭个节点的防火墙。

Hadoop配置信息：
hdfs-site.xml

dfs.namenode.secondary.http-address
node64:50090

    <property>
            <name>dfs.namenode.http-address</name>
            <value>node63:50070</value>
    </property>
    <property>
            <name>dfs.replication</name>
            <value>2</value>
    </property> 
    <property>
            <name>dfs.namenode.name.dir</name>
            <value>file:/root/hadoop-2.8.4/hdfs/name</value>
    </property>
    <property>
            <name>dfs.datanode.data.dir</name>
            <value>file:/root/hadoop-2.8.4/hdfs/data</value>
    </property>

这里写图片描述

core-site.xml

fs.defaultFS
hdfs://node63:9000

hadoop.tmp.dir
file:/root/hadoop-2.8.4/tmp
Abase for other temporary directories.

ha.zookeeper.quorum
node63:2181,node65:2181,node66:2181,node67:2181,node69:2181

     <property>
             <name>hadoop.proxyuser.hadoop.hosts</name>
             <value>*</value>
     </property>

     <property>
             <name>hadoop.proxyuser.hadoop.groups</name>
             <value>*</value>
     </property>

这里写图片描述

yarn-site.xml

yarn.resourcemanager.hostname
node63

yarn.nodemanager.aux-services
mapreduce_shuffle

     <property>
            <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
            <value>org.apache.hadoop.mapred.ShuffleHandler</value>
     </property>

     <property>
            <name>yarn.resourcemanager.address</name>
            <value>node63:8032</value>
     </property>

     <property>
            <name>yarn.resourcemanager.scheduler.address</name>
            <value>node63:8030</value>
     </property>

     <property>
            <name>yarn.resourcemanager.resource-tracker.address</name>
            <value>node63:8031</value>
     </property>

     <property>
            <name>yarn.resourcemanager.admin.address</name>
            <value>node63:8033</value>
     </property>

     <property>
            <name>yarn.resourcemanager.webapp.address</name>
            <value>node63:8088</value>
     </property>

这里写图片描述

mapred-site.xml

mapreduce.framework.name
yarn

mapreduce.jobhistory.address
node63:10020

mapreduce.jobhistory.webapp.address
node63:19888

这里写图片描述

vim slaves:
node65
node66
node67
node69
node70

vim hadoop-env.sh
添加：
export JAVA_HOME=/usr/local/jdk1.8.0_172
export HADOOP_OPTS=”-Djava.library.path=${HADOOP_HOME}/lib/native”
其他节点都是一样，配置完毕后拷贝即可
Zookeeper配置文件记录：
各节点的下创建data/myid，在myid里面输入zoo.cfg里面配置的数字：
vim conf/zoo.cfg
这里写图片描述
其他节点一样，data/myid内容不一样。

*hbase配置文件：
将zookeeper的zoo.cfg拷贝到habse的conf下。
vim hbase-site.xml

hbase.rootdir
hdfs://node63:9000/hbase

hbase.zookeeper.quorum
node63,node64,node65,node66,node67,node69,node70

hbase.zookeeper.property.dataDir
/root/zookeeper-3.4.12/data

hbase.cluster.distributed
true

hbase.regionserver.handler.count
20

hbase.regionserver.maxlogs
64

hbase.master.maxclockskew
150000

这里写图片描述
vim hbase-env.sh
export JAVA_HOME=/usr/local/jdk1.8.0_172
export HBASE_MANAGES_ZK=false
vim backup-masters—–备选的HMaster
node65
vim regionservers
node63
node64
node65
node66
node67
node69
node70
其他节点一样。

Hive配置文件：
node63
需要将来来连接数据库的驱动拷贝到lib中

vim hive-env.sh
HADOOP_HOME=/root/hadoop-2.8.4
export HIVE_AUX_JARS_PATH=/root/hive2/lib/
export HIVE_CONF_DIR=/root/hive2/conf/
vim hive-site.xml

hive.metastore.warehouse.dir
/hive/warehouse

hive.metastore.uris
thrift://node63:9083

hive.querylog.location
/root/hive2/logs

javax.jdo.option.ConnectionUserName
root

javax.jdo.option.ConnectionPassword
12345

javax.jdo.option.ConnectionURL
jdbc:mysql://node63:3306/hive?createDatabaseIfNotExist=true&useSSL=false

javax.jdo.option.ConnectionDriverName
com.mysql.jdbc.Driver

<property> 
    <name>hive.server2.webui.host</name> 
    <value>node63</value>
</property>

<property>
    <name>hive.server2.webui.host.port</name>
    <value>10002</value>
</property>

<property>
    <name>hive.zookeeper.quorum</name>
    <value>node63,node64,node65,node66,node67,node69,node70</value>
</property>

这里写图片描述

node70:
其他一样，
vim hive-site.xml

hive.metastore.warehouse.dir
/hive/warehouse

hive.metastore.uris
thrift://node63:9083

hive.querylog.location
/root/hive2/logs

<property>
     <name>hive.zookeeper.quorum</name>
     <value>node63,node64,node65,node66,node67,node69,node70</value>
</property>

这里写图片描述

Pig配置文件：
vim log4j.properties

log4j.logger.org.apache.pig=info, A
log4j.appender.A=org.apache.log4j.ConsoleAppender
log4j.appender.A.layout=org.apache.log4j.PatternLayout
log4j.appender.A.layout.ConversionPattern=%-4r [%t] %-5p %c %x - %m%n
pig.logfile=/root/pig-0.16.0/logs
log4jconf=/root/pig-0.16.0/conf/log4j.properties
exectype=mapreduce

Sqoop配置：
vim sqoop-env.sh

export HADOOP_MAPRED_HOME= $HADOOP_HOME export HADOOP_COMMON_HOME=$ HADOOP_HOME
export ZOOCFGDIR=/root/zookeeper-3.4.12
export HBASE_HOME=/root/hbase-2.0.0
export HIVE_HOME=/root/hive2
export HCAT_HOME=/root/hive2/hcatalogs
这里写图片描述
将 mysql-connector-java-6.0.6.jar拷贝到lib下

Spark配置文件：
安装见博客：https://blog.csdn.net/qq_25948717/article/details/80758713
vim spark-env.sh

export JAVA_HOME=/usr/local/jdk1.8.0_172 #这里路径为自己解压的JDK的路径
export CLASSPATH= ${JAVA_HOME}/lib export PATH=$ {JAVA_HOME}/bin: $PATH export HADOOP_HOME=/root/hadoop-2.8.4 export HADOOP_CONF_DIR=$ HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR= $HADOOP_HOME/etc/hadoop export HADOOP_COMMON_LIB_NATIVE_DIR=$ HADOOP_HOME/lib/native
export SCALA_HOME=/root/scala
export PATH= $PATH:$ SCALA_HOME/bin
export SPARK_HOME=/root/spark
export PATH= $PATH:$ SPARK_HOME/bin
export SPARK_MASTER_IP=node63
export SPARK_WORKER_MEMORY=2g