为什么搭建分布式Hadoop(只有HDFS)集群，跨阿里云和腾讯云呢？

最新推荐文章于 2024-05-15 20:49:43 发布

云计算开发者小艺

最新推荐文章于 2024-05-15 20:49:43 发布

阅读量222

点赞数

文章标签：腾讯云服务器云计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64346584/article/details/121489824

版权

本文讲述了作者为了研读HDFS源码，在阿里云和腾讯云间搭建分布式Hadoop（仅HDFS）集群的过程。通过配置Java环境、编辑hosts、设置ssh免密登录、关闭防火墙、安装与配置Hadoop，最终成功启动集群，并分享了遇到的三个问题及其解决方案。

摘要由CSDN通过智能技术生成

又几个月没写过文章了，今天随便写一写吧。

由于实际需要需要研读HDFS的源码，最好的方法就是加一些日志看NameNode是怎么运行的，又经常在外面，所以就需要在公网上搭一个分布式的Hadoop（只有HDFS）集群，有两个DataNode节点即可。但实际情况是我有一个阿里云服务器，有一个腾讯云服务器。联想到Hadoop可以跨机架，跨机房进行搭建，想了想从原理上来讲的话，这样应该也是可行的，于是抱着试一试的心态开始搭建跨云服务器（机房）的Hadoop集群。

我的阿里云服务器的公网IP为a11.b11.c11.d11，内网IP为a12.b12.c12.d12；腾讯云的服务器的公网IP为a21.b21.c21.d21，内网IP为a22.b22.c22.d22。

以阿里云的服务器为主，跑一个NameNode和一个DataNode，腾讯云服务器跑一个DataNode（个人腾讯云服务器跑了太多服务了，且配置等方面也不太够）。

下面开始。

首先，安装并配置Java环境，这就不多说了，apt-get或者yum安装一下，然后改一下环境变量即可。我安装的是Java7，因为我用的Hadoop的版本是hadoop2.6.0-cdh5.10.0，听说Java8会有问题，但我没有实际试过；

然后，编辑/etc/hosts文件，将本系统的别名编辑上去，在阿里云服务器上编辑如下：

最低0.47元/天解锁文章

云计算开发者小艺

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
为什么搭建分布式Hadoop(只有HDFS)集群，跨阿里云和腾讯云呢？

又几个月没写过文章了，今天随便写一写吧。由于实际需要需要研读HDFS的源码，最好的方法就是加一些日志看NameNode是怎么运行的，又经常在外面，所以就需要在公网上搭一个分布式的Hadoop（只有HDFS）集群，有两个DataNode节点即可。但实际情况是我有一个阿里云服务器，有一个腾讯云服务器。联想到Hadoop可以跨机架，跨机房进行搭建，想了想从原理上来讲的话，这样应该也是可行的，于是抱着试一试的心态开始搭建跨云服务器（机房）的Hadoop集群。我的阿里云服务器的公网IP为a11.b11.c11
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。