图 1 节点复用型MapReduce集群(上图)和节点分离型MapReduce集群(下图)
一 两种常见的MapReduce集群架构
图1,是两种常见的MapReduce集群,前一种可以更节点复用型集群的优点是(1)节约资源(2)提供更高的性能,调度器会根据数据的分布进行任务调度,尽量满足任务和对应的数据在同一物理节点,节点内的数据传输会比节点间的数据传输高。
后一种集群架构的优势是(1)维护方便,分布式存储系统与计算集群分离,各自维护(2)安全性高,采用集中式的存储在多租户的环境下可以较好的进行访问控制。