通过公网IP访问云上的Hadoop集群

本文档详细介绍了如何设置和配置,以便从公司内部网络的Hadoop集群通过公网IP访问云上的Hadoop集群。关键步骤包括为云上实例设置内网IP、绑定Elastic IP和配置域名,并在公司内部网络的Hadoop集群中修改配置文件以通过域名访问。同时,建议在云上Hadoop集群进行相应配置,以实现更灵活的节点通信。确保DNS的可靠性是这种方法成功的关键。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:从公司内部网络中的Hadoop集群访问部署在亚马逊云的Hadoop集群

公司内部网络访问亚马逊云上的Hadoop集群

1. IP、域名设置
1.1 给云上每个实例设置一个内网IP(如上图10.0.0.5)
1.2 给云上每个实例绑定一个Elastic IP(弹性IP,如上图X.X.X.1),并且与内网IP一一对应
1.3 给云上每个实例配置一个域名(如上图A001),并且与内网IP一一对应
1.4 给公司内部网络每台机器(实例)配置一个域名(同1.3的域名如A001),并且与Elastic IP一一对应
2. 公司内部网络Hadoop集群配置
2.1 此时公司内部网络中的Hadoop集群相对于云上的Hadoop集群为客户端,需要做如下配置:在hdfs-site.xml中添加dfs.client.use.datanode.hostname属性,表示通过域名访问
<property>
        <name>dfs.client.use.datanode.hostname</name>
        <value>true</value>
</property>
3. 云上Hadoop集群配置【建议】

可以考虑将云上服务器端的Hadoop集群配置文件hdfs-site.xml,增加dfs.datanode.
use.datanode.hostname属性,表示datanode之间的通信也通过域名方式。

<property>
        <name>dfs.datanode.use.datanode.hostname</name>
        <value>true</value>
</property>

这样能够使得更换内网IP变得十分简单、方便,而且可以让特定datanode间的数据交换变得更容易。但与此同时也存在一个副作用,当DNS解析失败时会导致整个Hadoop不能正常工作,所以要保证DNS的可靠。
总结:将默认的通过IP访问,改为通过域名方式访问。
https://rainerpeter.wordpress.com/2014/02/12/connect-to-hdfs-running-in-ec2-using-public-ip-addresses/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值