搭建hadoop-2.6.0分布式集群

最新推荐文章于 2019-10-31 02:46:37 发布

撸依天

最新推荐文章于 2019-10-31 02:46:37 发布

阅读量641

点赞数

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/korder/article/details/43019503

版权

hadoop 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

环境：Win7 + VM + Ubuntu

1、分别在3台虚拟Ubuntu机器上设置root用户密码，以后每次登录就用root

sudo -s 进入root权限模式

vim /etc/lightdm/lightdm.conf

[SeatDefaults]

user-session=ubuntu

greeter-session=unity-greeter

greeter-show-manual-login=true

allow-guest=false

启动root账号

sudo passwd root

三台机器修改后，再次用root用户登录

2、配置/etc/hosts和/etc/hostname

其中一台hostname为SparkMaster,另外俩台分别为SparkWorker1，SparkWorker2

并同步3台机器的hosts

3、配置无密登录

参考http://blog.csdn.net/korder/article/details/39541625

4、安装java环境

这个...就不废话了

5、去官网下载hadoop-2.6.0.tar.gz并安装

把下载下来的hadoop放在/usr/local/hadoop目录并解压

tar -xzvf hadoop-2.6.0.tar.gz 解压到当前目录

6、修改系统配置文件

vim ~/.bashrc

添加

export JAVA_HOME=/usr/lib/java/jdk1.7.0_71

export HADOOP_HOME=/usr/local/hadoop/hadoop-2.6.0

export JRE_HOME=${JAVA_HOME}/jre

export CLASS_PATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:$PATH

7、在hadoop目录创建相关文件夹

创建tmp和dfs文件夹

dfs文件夹下创建 name和data文件夹

8、修改hadoop配置文件

cd /usr/local/hadoop/hadoop-2.6.0/etc

a)

hadoop-env.sh

JAVA_HOME=${JAVA_HOME}

--->

JAVA_HOME=/usr/lib/java/jdk1.7.0_71

b)

yarn-env.sh

export JAVA_HOME=/usr/lib/java/jdk1.7.0_71

c)

mapred-env.sh

export JAVA_HOME=/usr/lib/java/jdk1.7.0_71

d)

slaves

SparkWorker1

SparkWorker2

e)

core-site.xml

f)

hdfs-site.xml

g)

mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

h)

yarn-site.xml

9、把修改的所有配置文件拷贝到SparkWorker1、SparkWorker2

scp -r /usr/local/hadoop root@SparkWorker1:/usr/local/hadoop

scp -r /usr/local/hadoop root@SparkWorker2:/usr/local/hadoop

scp ~/.bashrc roo@SparkWorker1:~/.bashrc

scp ~/.bashrc roo@SparkWorker2:~/.bashrc

10、启动并验证hadoop集群

a)

在SparkMaster机器上，格式化namenode

hadoop namenode -format

b) 进入sbin、启动hdfs

cd /usr/local/hadoop/hadoop-2.6.0/sbin

./start-dfs.sh

当jps发现SparkMastr有NameNode、SecondaryNameNode;

SparkWorker1、SparkWorker2分别都有DataNode；

说明启动成功了。

此时访问Web：

http://SparkMaster:50070可以查看HDFS集群状况

c) 启动yarn集群

cd /usr/local/hadoop/hadoop-2.6.0/sbin

./start-yarn.sh

当jps发现SparkMaster多出了ResourceManager；

SparkWorker1、SparkWorker2分别增加了NodeManager；

说明OK了。

此时访问Web：

http://SparkMaster:8088可以查看ResourceManager运行状态

http://SparkWorker1:8042查看SparkWorker1的NodeManager运行状态

http://SparkWorker2:8042查看SparkWorker2的NodeManager运行状态

d) 启动job history server

cd /usr/local/hadoop/hadoop-2.6.0/sbin

./mr-jobhistory-daemon.sh start historyserver

启动后可以通过

http://SparkMaster:19888在Web控制台查看job执行历史信息

结束history

./mr-jobhistory-daemon.sh stop historyserver

e) 验证hadoop集群

不多说了，自己在hdfs上准备好测试目录以及数据

运行hadoop自带的wordcount：

hadoop jar ../hadoop/mapreduce/share/hadoop-mapreduce-example-2.6.9.jar wordcount /data/wordcount /output/lwordcount

也可以通过Web页面观察一下运行状态

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
搭建hadoop-2.6.0分布式集群

环境：Win7 + VM + Ubuntu 1、分别在3台虚拟Ubuntu机器上设置root用户密码，以后每次登录就用rootsudo -s 进入root权限模式vim /etc/lightdm/lightdm.conf [SeatDefaults]user-session=ubuntugreeter-session=unity-greetergreeter-s
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

撸依天 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。