在前面写到的三篇博客中,HDFS概述 和 MapReduce简介写的都是hadoop1.0的情况,针对1.0版本的各种不足,2.0都有相应的改动, HDFS再学习:HA和Federation机制写的是存储系统HDFS上的改动。针对我们的计算模型MapReduce,2.0版本设计了新的资源管理框架YARN。
组件 | Hadoop1.0的问题 | Hadoop2.0的改进 |
---|---|---|
HDFS | 单一节点问题 | Hdfs HA提供热备机制 |
HDFS | 单一命名空间 | Hdfs Federation管理多命名空间 |
MapReduce | 资源管理效率低 | 新的资源管理框架YARN |
MapReduce1.0的缺陷
回顾一下MapReduce1.0的结构,,详细的可以去看上一篇博客: