HDFS再学习:HA和Federation机制

通过之前(上一篇HDFS的博客)的学习我们已经了解到了hdfs的一些大致基本情况,这篇博客主要补充一下针对HDFS1.0的不足,HDFS2.0的HA机制和Federation机制。

先对之前的学习做个小概括:
hadoop的特点有:

  • 数据的分布存储:HDFS由一个管理节点和若干个数据节点组成,每个节点是一台普通计算机。底层的实现是将一个很大的数据进行切分成块,块分散存储在不同数据节点上。
  • Hadoop中有一个作为主控的JobTracker,用于调度和管理其他的TaskTracker,JobTracker可运行于集群的任何一台机子上,而TaskTracker负责执行任务,必须运行于数据节点上。也就是说DataNode既是数据节点,也是计算节点
  • 本地计算:数据存储在哪台机子上,就由这台机子进行这部分的计算,这样可以减少网络的传输,“移动计算比移动数据更经济”
  • 任务粒度:把原始数据集切分成小数据集的时候,通常让小数据集小于或等于HDFS中的一个块大小,便于一个数据集存储于一台机子,方便计算。有M个小数据集,就有M个Map任务,这M个Map任务分布于N台机器上,Reduce任务的数量则由用户指定
  • 任务管道:有R个Reduce任务,就有R个结果,通常这R个最终结果是不需要合并成一个结果的。他们可能又作为另一个计算任务的输入,开始另一个计算。

HDFS作为hadoop的分布式存储系统,具有:能处理超大文件,运行于廉价机器集群和流式访问数据。
同样的这些优点的背后就有它的

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值