一 什么是Hadoop
二 Hadoop中的主要项目
三 参考书籍
《Hadoop Yarn权威指南》
四 Hadoop演进的四大阶段
五 阶段0:Ad Hoc集群时代
六 阶段1:Hadoop on Demand
七 Hadoop on Demand的架构
八 HOD的特点和优势
九 HOD的缺点
十 阶段2:共享计算集群的黎明
十一 共享MapReduce的特征
十二 共享MapReduce的问题
十三 阶段3:YARN的出现
十四 Yarn必须满足的十大要求
要求1:可扩展性,可以平滑的扩展至数万个节点和并发的应用
要求2:可维护性,保证集群软件的升级与用户应用程序完全解耦
要求3:多租户,需要支持在同一个集群中多个租户并存,同时支持多个租户之间细粒度地共享单个节点
要求4:位置感知,将计算移动到数据所在的位置
要求5:高集群使用率,实现底层物理资源的高使用率。
要求6:安全和可审计的操作,继续以安全的、可审计的方式使用集群资源
要求7:可靠性和可用性,具有高度可靠的用户交互,并支持高可用性
要求8:对编程模型多样性的支持,支持多样化的编程模型,并需要演进为不仅仅以MapReduce为中心
要求9:灵活的资源模型,支持各个节点的动态资源配置以及灵活资源模型
要求10:向后兼容,保持现有MapReduce应用程序的向后兼容