接触了近一年的Hadoop,对MapReduce的工作流程,容错机制都有了一些浅显的理解。自己也写过一些加载文件和排序的MapReduce,但一直处于学习阶段,对MapReduce在集群上的应用理解还是太浅,在这说说我对MapReduce负载均衡的认识。
一、Randomized Hydrodynamic Load Balancing:基本内容
负载平衡用来确保在使用其他资源时您现有的资源都不是空闲的。若要平衡负载分布,可以将负载从源节点(有多余工作负载)的迁移到相对较轻的负载目标节点。
在运行时应用负载平衡时,它被称之为动态负载平衡— 这可以根据执行节点选择直接实现或以迭代的方式实现: