hadoop默认配置里http address接口domain段均为0.0.0.0,表示可通过任一网卡访问http接口,对于双网卡服务器(一个内网,一个外网),意味着公网用户可以随意访问hadoop系统开放的web资源,存在极大的安全隐患。我们可以修改配置将domain段替换成内网IP,这对于dfs.http.address、mapred.job.tracker.http.address没什么问题,但dfs.datanode.http.address需要到每个datanode上去修改,这太不现实了,可以通过以下方法实现自动配置。
通过local.bind.address参数 为http address绑定内网IP:
1、修改$HADOOP_HOME/conf/hadoop-env.sh(我采用最后一种方式,将hostname指向内网IP)
#bind_ip=$(/sbin/ifconfig eth1:0 | grep 'inet addr:' | cut -d: -f2 | awk '{print $1}')
#replace eth1:0 with your NIC / alias 这种方式需要所有机器内外网对应的网卡顺序一致
#bind_ip=$(/sbin/ifconfig | fgrep 'inet addr:172.16' | cut -d: -f2 | awk '{print $1}')
#这种方式需要所有机器内网IP前缀一致
bind_ip=$(/bin/hostname)
#这种方式需要在/etc/hosts里将hostname指向内网IP
export BIND_OPTS="-Dlocal.bind.address=${bind_ip}"
# Command specific options appended to HADOOP_OPTS when specified
export HADOOP_NAMENODE_OPTS="-Dcom.sun.management.jmxremote $HADOOP_NAMENODE_OPTS $BIND_OPTS"
export HADOOP_SECONDARYNAMENODE_OPTS="-Dcom.sun.management.jmxremote $HADOOP_SECONDARYNAMENODE_OPTS $BIND_OPTS"
export HADOOP_DATANODE_OPTS="-Dcom.sun.management.jmxremote $HADOOP_DATANODE_OPTS $BIND_OPTS"
export HADOOP_BALANCER_OPTS="-Dcom.sun.management.jmxremote $HADOOP_BALANCER_OPTS $BIND_OPTS"
export HADOOP_JOBTRACKER_OPTS="-Dcom.sun.management.jmxremote $HADOOP_JOBTRACKER_OPTS $BIND_OPTS"
export HADOOP_TASKTRACKER_OPTS="-Dcom.sun.management.jmxremote $HADOOP_TASKTRACKER_OPTS $BIND_OPTS"
2、修改$HADOOP_HOME/conf/hdfs-site.xml( 这一步只能将datanode相关的address替换为预设变量)
<property>
?? ?<name>dfs.http.address</name> ?
?? ?<value>Master1-IP:50070</value> ?
</property> ?
<property> ?
?? ?<name>dfs.https.address</name> ?
?? ?<value>Master1-IP:50470</value> ?
</property> ?
<property> ?
?? ?<name>dfs.secondary.http.address</name> ?
?? ?<value>Master2-IP:50090</value> ?
</property> ?
<property> ?
?? ?<name>dfs.datanode.address</name> ?
?? ?<value>${local.bind.address}:50010</value> ?
</property> ?
<property> ?
?? ?<name>dfs.datanode.ipc.address</name> ?
?? ?<value>${local.bind.address}:50020</value> ?
</property> ?
<property> ?
?? ?<name>dfs.datanode.http.address</name> ?
?? ?<value>${local.bind.address}:50075</value> ?
</property> ?
<property> ?
?? ?<name>dfs.datanode.https.address</name> ?
?? ?<value>${local.bind.address}:50475</value> ?
</property>
3、修改$HADOOP_HOME/conf/mapred-site.xml(这一步只能将tasktracker相关的address替换为预设变量)
<property>
<name>mapred.job.tracker.http.address</name>
<value>Master1-IP:50030</value>
</property>
<property>
<name>mapred.task.tracker.http.address</name>
<value>${local.bind.address}:50060</value>
</property>
4、重启
$HADOOP_HOME/bin/stop-all.sh
$HADOOP_HOME/bin/start-all.sh
附:
1.下表列出了多种HDFS中默认端口
2.下表列出的各种MapReduce服务使用的默认端口