hadoop 自学指南七之hadoop2.x 特性

一、hadoop 2.x 产生背景:
    --hadoop 1.x hdfs MapReduce 在高可用,扩展性
    --hdfs 存在问题
        nameNode 单点故障
        nameNode 压力过大
    --MapReduce
        JobTracker 访问过大,影响系统扩展性
        难以支持MapReduce之外的计算框架,spark/storm
二、hadoop 2.x 的特性
    1hdfs: NNFederationHA;
        基于Zookeeper FailoverController : 监控NameNode 健康状态
    2MapReduce : 运行在YARN上的MR
    3YARN: 资源管理系统
        核心思想:将MapReduce JobTracker 的资源管理 和任务调度两个功能分开
           分别ResourceManager ApplicatonMaster
        ResourceManager : 负责整个集群的资源管理 和调度
          ApplicationMaster: 负责应用程序相关的事务,比如任务高度,任务监控

        解决hdfs 1.x 中单点故障和内存受限问题
        解决单点故障
            HDFS HA : 通过主备NameNode 解决
        解决内存受限问题
            HDFS Federation
            水平扩展,支持多个NameNode
            每个NameNode 分管一部分目录
            所有NameNode 共享所有DataNode

    4MapReduce On YARN :
        MapReduce 作业直接运行在YARN,而不是JobTracker TaskTracker

        基本功能模块:
            YARN:负责资源管理和调度
            MRAppMaster : 负责任务切分,任务调度、任务监控和容错
            MapTask/ReduceTask :任务任务驱动引擎与MR1一致
            每个MapReduce 作业对应一个MRAppMaster
                MRAppMaster 任务调度
                YARN将资源分配给MRAppMaster
                MRAppMaster 进一步将资源分配给内部的任务
            MRAppMaster 容错
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值