本文的部分图片、文字来自于HKU COMP7305 Cluster and Cloud Computing,Professor: C.L.Wang
hadoop官方文档:http://hadoop.apache.org/docs/r2.7.5/
拓扑结构和硬件配置
先讲一下Hadoop之前的底层的结构,我们是4人一组,每个人一台机器,装上Xen,然后用Xen开两个VM,就是一共8个VM,配置上格式跟下图大同小异(我们是一个i5的CPU,3个2.9GHz的i3CPU ,内存都是16G的),我们用配置最高的那台机器当master。我们的Hadoop版本是2.7.5,具体的配置方法可能难以全写下,这里挑一部分写。
一个master控制8个VM的方法:
首先是在master node 里 Add key to all VMs ,然后用ssh做一下test
然后在master node 的 /opt/hadoop-2.7.5/etc/hadoop/slaves 这个里面
在slave里 /opt/hadoop-2.7.5/etc/hadoop/masters
加上master node
然后在core-site和yarn-site这俩xml文件里分别写上hdfs的地址和hostname
core:
yarn:
然后写个脚本把4个配置文件(core、hdfs、mapred、yarn -site.xml)都从当前的master copy到slave上
脚本里大概就是这种的内容
scp /opt/hadoop-2.7.5/etc/hadoop/core-site.xml student61-x1:/opt/hadoop-2.7.5/etc/hadoop/core-site.xml
如果slave之前有hdfs,那么如果有必要可以先删了
rm -rf /var/hadoop/hadoop-hduser/dfs/*