Hadoop分布式集群的搭建

最新推荐文章于 2024-08-25 12:13:51 发布

What’smean

最新推荐文章于 2024-08-25 12:13:51 发布

阅读量389

点赞数

分类专栏： Hadoop 文章标签： Hadoop Hadoop集群安装分布式Hadoop集群

本文链接：https://blog.csdn.net/weixin_42492218/article/details/81255108

版权

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.准备工作

（1）三台虚拟机

（2）hadoop-2.6.4安装包

2.Hadoop安装

(1)root用户复制文件到hadoop01的/usr/apps/hadoop目录下，解压缩

（2）将hadoop添加到环境变量中

（3）修改配置文件，修改Windows主机的hosts文件

（5）将配置好的hadoop拷贝到其他节点

（6）启动zookeeper集群

（7）启动journalnode（分别在hadoop01、hadoop02、hadoop03上执行）

（8）格式化HDFS

（9）格式化ZKFC(在hadoop01上执行一次即可)

（10）启动HDFS(在hadoop01上执行)

（11）启动YARN

（12）启动历史服务器

2.Hadoop安装

(1)root用户复制文件到hadoop01的/usr/apps/hadoop目录下，解压缩

使用xftp上传文件

tar –zxvf cenos-6.6-hadoop-2.6.4.tar.gz

（2）将hadoop添加到环境变量中

vi /etc/profile

在配置文件中对export进行添加更改

export HADOOP_HOME=/’usr/apps/hadoop

上传到各个节点

scp –r /etc/profile root@hadoop02:/etc/

（3）修改配置文件，修改Windows主机的hosts文件

A．修改hadoop-env.sh

hadoop-env.sh

export JAVA_HOME=/usr/apps/java/jdk1.7.0_80

B．修改core-site.xml

core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/apps/hdpdata</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>

</property>

C．修改hdfs-site.xml

hdfs-site.xml

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.jsj</name>

</property>

<name>dfs.namenode.rpc-address.jsj.nn1</name>

<value>hadoop01:9000</value>

</property>

<name>dfs.namenode.rpc-address.jsj.nn2</name>

<value>hadoop02:9000</value>

</property>

<name>dfs.namenode.http-address.jsj.nn1</name>

<value>hadoop01:50070</value>

</property>

<name>dfs.namenode.http-address.jsj.nn2</name>

<value>hadoop02:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/jsj</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/usr/apps/journaldata</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.jsj</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

shell(/bin/true)

</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hadoop/.ssh/id_rsa</value>

</property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

</property>

D．修改mapred-site.xml

mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

<value>hadoop03:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hadoop03:19888</value>

</property>

E．修改yarn-site.xml

yarn-site.xml

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

</property>

<name>yarn.resourcemanager.ha.rm-ids</name>

</property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>hadoop01</value>

</property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>hadoop02</value>

</property>

<name>yarn.resourcemanager.zk-address</name>

<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

F．修改slaves

slaves

hadoop02

hadoop03

hadoop04

（5）将配置好的hadoop拷贝到其他节点

上传到各个节点

Scp –r hadoop hadoop@hadoop02:/usr/apps/

（6）启动zookeeper集群

zkSever.sh start

（7）启动journalnode（分别在hadoop01、hadoop02、hadoop03上执行）

Hadoop-daemon.sh start journalnode

（8）格式化HDFS

Hdfs namemode –format

cd /usr/apps

scp –r hdpdata hadoop@hadoop02:/usr/apps/

hadoop-daemon.sh start namenode

hadoop02 上 hdfs nameNode –bootstrapstandby y

（9）格式化ZKFC(在hadoop01上执行一次即可)

hdfs zkfc –formatzk

（10）启动HDFS(在hadoop01上执行)

start-dfs.sh

（11）启动YARN

Start-yarn.sh

（12）启动历史服务器

mr-jobhistory-damon.sh start historysever

What’smean

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录