MapReduce是什么?有什么特点?
MapReduce是基于Google发布的MapReduce论文设计开发,用于大规模数据集(大于1TB)的并行计算,
Cluster Infrastructure、Software Framework、Programming Model & Methodology)。
特点如下:
易于编程:程序员仅需要描述做什么,具体怎么做交由系统的执行框架处理。
良好的扩展性:可通过添加节点以扩展集群能力。
高容错性:通过计算迁移或数据迁移等策略提高集群的可用性与容错性。
什么是Yarn?
Apache Hadoop YARN(Yet Another Resource Negotiator),Hadoop资源管理器,一个通用资源管理系统,为上层提供统一的资源管理和调度,为集群在利用率、资源统一管理和数据共享等方面带来巨大好处。