建立学习用小型Hadoop集群

最新推荐文章于 2021-08-23 13:07:31 发布

大数据框架Hadoop学习

最新推荐文章于 2021-08-23 13:07:31 发布

阅读量195

点赞数

分类专栏： 2019年5月 2019年3月 2019年1月 2018年11月 2018年9月 2015年3月 2017年6月 2010年9月 2006年5月 2004年3月 2014年3月 2018年10月 2018年12月 2019年2月 2019年4月文章标签：大数据程序员编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38460284/article/details/90207317

版权

2019年5月同时被 3 个专栏收录

48 篇文章 0 订阅

订阅专栏

35 篇文章 0 订阅

订阅专栏

30 篇文章 0 订阅

订阅专栏

系统安装完毕进行Hadoop的简单配置：

1. hadoop-env.sh配置JAVA_HOME

2. masters文件指定备用namenode，slaves文件指定tasktracker

3. core-site.xml设置dfs.default.name为hdfs://namenode

4. hdfs-site.xml设置dfs.name.dir和dfs.data.dir目录

5. mapred-site.xml设置mapred.job.tracker为jobtracker机器名/ip，还有mapred.local.dir和mapred.system.dir目录

设置完毕再namenode上start-dfs.sh，在jobtracker上start-mapred.sh，遇到以下问题：datanode连不上namenode，org.apache.hadoop.ipc.Client: Retrying connect to server: namenode:8020。解决办法如下：

1. 关闭Ubuntu防火墙，sudo ufw disable，如果要再开启防火墙，注意允许22端口，ufw allow 22/tcp，参考/etc/ufw/ufw.conf

2. 在namenode上netstat -na | grep 8020，发现只绑定了127.0.0.1，在/etc/hosts里注释本地主机名和127.0.0.1的绑定，只绑定静态ip即可。

如果没进行上述设置，则dfshealth.jsp显示DFS Used 100%，而且Live Nodes为0。试图运行mapreduce也会出现File * could only be replicated to 0 nodes, instead of 1错误。

推荐阅读文章

大数据工程师在阿里面试流程是什么？

学习大数据需要具备怎么样基础？

年薪30K的大数据开发工程师的工作经验总结？

大数据框架Hadoop学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。