hadoop实战-05.配置hadoop小集群(3台主机)

最新推荐文章于 2023-04-03 21:03:09 发布

vinking9393

最新推荐文章于 2023-04-03 21:03:09 发布

阅读量180

点赞数

分类专栏： linux ubuntu 文章标签： linux ubuntu hadoop 集群搭建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vinking9393/article/details/84806770

版权

linux 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

配置3台主机hadoop小集群：

将之前配置好的伪分布式的ubuntu虚拟机克隆多两份，一共三份

因为3台机的配置是一样的，所以可以省去很多的安装，jdk，ssh，hadoop的安装

为这3台机分配角色：

ubuntu1 172.19.43.178 master,namenode,jobtracker-master

ubuntu2 172.19.43.114 slave1,datanode,tasktracker-slave1

ubuntu3 172,19.43.98 slave2,datanode,tasktracker-slave2

在3台主机上分别设置/ect/hosts及/etc/hostname

/etc/hosts

127.0.0.1

172.19.43.178 master

172.19.43.114 slave1

172.19.43.98 slave2

/etc/hostname

主机名 master/slave1/slave2

因为这3台机都是一样的配置，所以ssh的配置密钥都是一样的，就没有做特别的操作，不然的话就要将master的文件复制到两个slave上

#scp authorized_keys slave1:~/.ssh/

#scp authorized_keys slave2:~/.ssh/

现在试试看可不可以从master免密码登录slave，都登录成功啦。

#ssh slave1

#ssh slave2

重新配置 core-site.xml ,hdfs-site.xml, mapred-site.xml 这3个文件及masters, slaves 这两个文件

3个主机的masters ，slaves 都配置成如下：

分别重新格式化3台机的hdfs，

#bin/hadoop namenode -format

在master主机上启动hadoop

#bin/start-all.sh

在master上启动服务后，其他slave的也会跟着启动。

查看启动是否成功

补充点教材上的排错知识：

如果大家在安装的时候遇到问题，或者按步骤安装完成却不能运行Hadoop，那么建议仔细查看日志信息。Hadoop记录了详尽的日志信息，日志文件保存在logs文件夹内。

无论是启动还是以后会经常用到的MapReduce中的每一个Job，或是HDFS等相关信息，Hadoop均存有日志文件以供分析。

例如：NameNode和DataNode的namespaceID不一致，这个错误是很多人在安装时都会遇到的。日志信息为：

java.io.IOException: Incompatible namespaceIDs in /root/tmp/dfs/data:namenode namespaceID = 1307672299; datanode namespaceID = 389959598

若HDFS一直没有启动，读者可以查询日志，并通过日志进行分析，日志提示信息显示了NameNode和DataNode的namespaceID不一致。

这个问题一般是由于两次或两次以上格式化NameNode造成的，有两种方法可以解决，第一种方法是删除DataNode的所有资料，第二种方法就是修改每个DataNode的namespaceID（位于/dfs/data/current/VERSION文件中）或修改NameNode的namespaceID（位于/dfs/name/current/VERSION文件中）。使其一致。

下面这两种方法在实际应用也可能会用到。

1）重启坏掉的DataNode或JobTracker。当Hadoop集群的某单个节点出现问题时，一般不必重启整个系统，只须重启这个节点，它会自动连入整个集群。

在坏死的节点上输入如下命令即可：

bin/Hadoop-daemon.sh start datanode

bin/Hadoop-daemon.sh start jobtracker

2）动态加入DataNode或TaskTracker。下面这条命令允许用户动态地将某个节点加入到集群中。

bin/Hadoop-daemon.sh --config ./conf start datanode

bin/Hadoop-daemon.sh --config ./conf start tasktracker

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop实战-05.配置hadoop小集群(3台主机)

配置3台主机hadoop小集群：将之前配置好的伪分布式的ubuntu虚拟机克隆多两份，一共三份因为3台机的配置是一样的，所以可以省去很多的安装，jdk，ssh，hadoop的安装为这3台机分配角色：ubuntu1 172.19.43.178 master,namenode,jobtracker-masterubuntu2 172.19.43.114 slave1,dat...
复制链接

扫一扫

专栏目录

vinking9393 CSDN认证博客专家 CSDN认证企业博客

码龄14年

44: 原创

24万+: 周排名

9万+: 总排名

5万+: 访问

: 等级

544: 积分

88: 粉丝

117: 获赞

4: 评论

365: 收藏

私信

关注

热门文章

分类专栏

摄影入门
统计基础 3篇
spss 1篇
数据分析 23篇
算法 5篇
linux 7篇
ubuntu 7篇
大数据 9篇
vsftp 1篇
python 4篇
编程学习 5篇

最新评论

4-如何进行细分市场的分析-02 细分行业的构成和基本情况
CSDN-Ada助手: 尊敬的博主，恭喜您已经写了第20篇博客！您的持续创作让我们受益良多。在这篇博客中，您对细分市场的分析进行了深入的探讨，尤其是对细分行业的构成和基本情况进行了详细阐述，让我们受益匪浅。希望您在接下来的创作中，能够进一步探讨如何应用这些分析结果来指导实际的市场营销策略制定，或者结合案例进行实际操作的分享。期待您的下一篇博客！
4-如何进行细分市场的分析-01摸清产业链构成，及各环节的基本态势
CSDN-Ada助手: 恭喜您发布了第19篇博客，内容涉及如何进行细分市场的分析，着实让人受益匪浅。对于摸清产业链构成及各环节的基本态势，您的分析十分详尽，让读者受益匪浅。在下一步的创作中，我建议您可以进一步深入探讨如何利用市场分析结果制定有效的营销策略，或者结合案例分析进行实践性的分享，这样可以更好地帮助读者在实际操作中更好地运用所学知识。期待您的更多精彩内容，加油！
游戏分析的那些事
CSDN-Ada助手: 恭喜您写了第18篇博客！标题“游戏分析的那些事”非常吸引人。您对游戏分析的深入探讨让读者对这个话题更加感兴趣。不过，我想给您提个建议：或许在接下来的博客中，您可以进一步探讨具体的游戏分析方法或者案例，这样读者们可以更好地理解和应用您的观点。继续保持创作，期待您的下一篇博客！
数据分析之归因分析，多因素影响下如何归因？
Caused by: 字也太小了吧。这么小谁看啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。