犹记得是本科毕设做的基于hadoop做的云备份系统,于是在部署hadoop2.6版本时候遇到的一些配置方面的问题做了点总结,按照官方的配置有些问题。
hadoop版本:2.6.0
linux系统:ubuntu 12.04 (官方推荐的ubuntu版本)
安装路径:/usr/hadoop-2.6.0
在ubuntu下安装部署hadoop需要注意的事项:
1、检查主机名称不要映射到127.0.0.1或127.0.1.1,编辑文件/etc/hosts,注释掉127.0.1.1主机名称的映射,写上当前地址加主机名称并保存。
2、master和slave主机要编辑/etc/hosts文件添加主机名称地址映射,测试能ping通主机即可。
3、所有机器不论是master还是slaves都使用同一安装文件,所以在配置中要指定master和slave的主机名称,配置文件在${HADOOP_HOME}/etc/hadoop/master
和${HADOOP_HOME}/etc/hadoop/slaves
中编辑,一行一个主机名称。
各个关键配置文件:(可做参考)
core-site.xml 配置:
<configuration>
<property>
<name>hadoop.tmp.dir </name>
<value>/usr/hadoop-2.6.0/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://Master:9000</value>
</property>
</configuration>
hdfs-site.xml 配置:
<configuration>
<property>
<name>dfs.replication </name>
<value>1 </value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/hadoop-2.6.0/dfs/name </value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/hadoop-2.6.0/dfs/data</value>
</property>
<property>
<name>dfs.http.address</name>
<value>Master:50070</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>Master:50090</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
在 mapred-site.xml 中配置其使用 Yarn 框架执行 map-reduce 处理程序,详细如下:
mapred-site.xml 配置:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
Yarn-site.xml 配置:
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce.shuffle</value>
</property>
</configuration>