Hadoop 2.0底层原理理解

  • Hadoop1.0面临的问题

    HDFS存在的问题:

        Name Node 单点故障,难以引用于在线场景

        Name Node压力过大,切内存受限,影响系统扩展性

    MapReduce存在问题:

       JobTracker访问压力大,影响系统扩展性

       不支持除MapReduce之外的其他计算框架

  • Hadoop1.X与Hadoop2.X区别

        Hadoop2.X有HDFS,YARN,MapReduce组成,YARN资源管理系统

        Hadoop1.X中,只有一个Name Node,虽然存在secondery name node进行数据备份,但是存在延迟,有数据丢失的可能。

        Hadoop2.X中,Name Node可以水平扩展,可以有多个Name Node,每个name node之间相互独立,互不影响,data node向每个Name Node注册,作为他们共同的存储点,同时向每个name node提供心跳和块使用情况,并处理Name Node向其发送的指令。(同一个DataNode上不同NameNode使用的快通过文件夹形式进行隔离)

       ViewFs文件系统可实现不同Name Node的文件管理

  • Hadoop2.X解决的问题

       解决单点故障问题

       解决内存受限问题,水平扩展,支持多个NameNode,每个NameNode分管一部分DataNode,所有NameNode共享DataNode存储资源。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值