Hadoop——HDFS HA与联邦原理

最新推荐文章于 2024-08-24 12:24:06 发布

Devin01213

最新推荐文章于 2024-08-24 12:24:06 发布

阅读量8.8k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ym01213/article/details/80037502

版权

本文介绍了Hadoop1.0的局限性，然后重点讲解了HDFS2.0的新特性，包括HDFS HA高可用架构，通过双NameNode实现故障切换，以及HDFS联邦如何解决系统扩展性、性能和隔离性问题，实现命名服务的水平扩展。

摘要由CSDN通过智能技术生成

本节目标：

1.了解Hadoop1.0的局限与不足

2.掌握HDFS 2.0 的新特性

1 Hadoop的局限与不足

Hadoop1.0的核心组件MR和HDFS主要有几个不足：

（1）抽象层次低。对于简单的功能，编写大量的代码。

（2）表达能力有限。MR把复杂分布式编程工作高度抽象到两个函数上，即Map和Reduce上，实际生产环境中有些不能只用简单的两个函数完成。

（3）要管理作业间复杂的依赖关系。实际应用通常需要大量的job协作完成，job之间往往存在复杂的依赖关系。

（4）迭代效率低。对于需要迭代的任务，需要反复读写HDFS文件中的数据，大大降低了迭代效率。

（5）资源浪费。Reduce任务需要等待所有Map任务完成后才开始。

（6）实时性差。适用于离线批处理。

2 从1.0到2.0的改进

3 HDFS2.0新特性

主要是HDFS HA和HDFS联邦两个新特性。

3.1 HDFS HA

对于分布式文件系统HDFS ，NN是系统的核心节点，存储了各类元数据信息，并负责管理文件系统的命名空间和客户端对文件的访问。但是，在HDFS1.0中，只存在一个NN，一旦发生“单点故障”

最低0.47元/天解锁文章

关注

4
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。