Hadoop再探讨

hadoop只有MapReduce和HDFS组件的时候的不足

1)抽象层次低,需要大量的人工编码
2)表达能力有限(不是所有的问题都能转化成MapReduce)
3)开发者自己管理作业(job)之间的依赖关系
4)难以看到程序整体逻辑(只能通过看代码才能理解到其中执行的逻辑)
5)执行迭代操作效率低(每执行一次都需要读写一次磁盘)
6)资源浪费(Map和Reduce分两个阶段运行)
7)实时性差(适合批注理,不支持实时交互)

优化:1>自身核心组件MapReduce和HDFS的改进(hadoop2.0)


2>其他组件的不断加入和更新(pig、spark、kafka和tez等组件)


HDFS HA(high available解决热备份的问题)

HDFS HA是为了解决单点故障问题
HA集群设置两个名称节点,“活跃”和“待命”
两个名称节点的状态同步,可以借助于一个共享存储系统来实现(实现同步Editlog)
一旦活跃名称节点出现故障,就可以理解切换到待命名称节点
Zookeeper确保一个名称节点在对外服务(只能有一个节点对外提供服务)
名称节点维护映射信息,数据节点同时向两个名称节点汇报信息(实现同步FSImage)


HDFS Feferation(解决扩展性、系统的吞吐量(性能)、隔离性)

HDFS Feferation中设计了多个相互独立的名称节点,使得HDFS的命名服务能够水平的扩展,这些名称节点分别进行各自命名空间和块的管理,相互之间是联盟(Feferation)的关系,不需要彼此协调。

HDFS Feferation所有的名称节点共享底层的存储资源,数据节点向所有的名称节点汇报
属于同一命名空间的块构成一个“块池”(块池是一个逻辑

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值