hadoop 2(0.23.x) 与 0.20.x比较

最新推荐文章于 2024-09-11 10:30:00 发布

leibnitz09

最新推荐文章于 2024-09-11 10:30:00 发布

阅读量167

点赞数

分类专栏： hadoop-2.5 hadoop 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leibnitz09/article/details/84242306

版权

hadoop 同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

16 篇文章 0 订阅

订阅专栏

以下大部分内容来自网络,这里主要是进行学习,比较

1、Hadoop 0.20.*的局限性

HDFS单NameNode的不足
1）扩展性问题。可以随着数据量进行水平扩展，而元数据服务器不能扩展。

   2）随着文件数目的增长，元数据服务器的压力变大。据统计，2.5亿个文件在NameNode中Namespace占据的大概64GB的内存空间。
    3）文件操作的吞吐率受到单个元数据服务器的限制。目前，Hadoop 0.20.*版本可以达到120k readops/sec，6000 writeops/sec.
    4)隔离性的问题。

MapReduce编程模型与运行时环境紧耦合
1）集群资源利用率较低。整个集群资源按照固定Slot为单位进行资源分配，没有考虑MapTask、ReduceTask任务的特点和逻辑关系进行不同的配置。

2)仅支持MapReduce编程模型。

单个JobTracker的单点故障和扩展性

1）JobTracker的负载较重。JobTracker负责作业和任务的初始化、以及提供TaskTracker的RPC Server、任务的调度等任务。因此，JobTracker一旦故障，所有执行的任务的状况丢失。

2）扩展性问题。

2.Hadoop-2(0.23)的New Features

HDFS Federation

1) Namespace与block Management解耦。

MapReduce NextGen aka YARN

1）编程模型与运行时框架解耦。

2）运行时环境的扩展性与单点故障问题。

可见,hadoop 2是针对性地解决了hadoop 0.20.x中的问题.

ref:

Hadoop0.23.0初探1---前因后果

补充一下线上资源:

1.0.X - current stable version, 1.0 release
1.1.X - current beta version, 1.1 release
2.X.X - current alpha version
0.23.X - simmilar to 2.X.X but missing NN HA.
0.22.X - does not include security
0.20.203.X - legacy stable version
0.20.X - legacy version

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。