Hadoop 2.x理论知识

最新推荐文章于 2020-03-08 16:07:58 发布

Coselding

最新推荐文章于 2020-03-08 16:07:58 发布

阅读量368

点赞数

分类专栏： hadoop 基础知识 linux Java 文章标签：云计算大数据 hadoop hdfs mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014394255/article/details/53449556

版权

Java 同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

本文为博主原创，允许转载，但请声明原文地址： http://www.coselding.cn/article/2016/05/31/Hadoop 2.x理论知识/

Hadoop1.x的问题：
（1） NameNode的单点故障问题；
（2） NameNode的内存限制和可拓展性问题；
（3） JobTracker访问过大，影响系统可拓展性；
（4）难以支持MapReduce以外的计算框架；

Hadoop2.x包括：
高可用HDFS、YARN、MapReduce2
（1） HDFS：Federation（联邦）、HA（High Available，即高可用）
HA：主备NameNode，主NameNode故障自动切换到备NameNode执行
Federation：支持多个NameNode，每个NameNode分管一部分目录，共享共同的DataNode
注：仅架构发生变化，对用户透明，使用方式和以前一致
（2） MapReduce2：运行在YARN上
（3） YARN：资源管理系统

Hadoop2.x架构图（HDFS的HA）

HA：（1）NN：NameNode，分为主Active和备Standby，故障自动切换或根据需求手动切换；
（2）DN：DataNode，启动时向主备所有NameNode汇报自己的数据块信息，简历数据块映射；
（3）JN：JournalNode，由于主NameNode故障需要切换到备NameNode，editlog实时NameNode更新缓存存在主NameNode显然不合理，便存在JournalNode中；
主NameNode实时更新内存中的NameNode信息，并更新JournalNode中的相应日志信息editlog，之后备NameNode再从JournalNode当中获取editlog更新自己内存中的NameNode信息，实现数据分离和主备NameNode数据同步的功能（没有SecondaryNameNode了）。
相比NFS，多台JournalNode实现了高可用。
（4） FailoverController：检测各个NameNode的工作健康状态（心跳检测），并向上汇报给ZooKeeper，这样ZooKeeper就知道当前哪个NameNode为可用，发现主NameNode故障时命令其中一个备NameNode的切换成主NameNode（竞争锁）。
一个FailoverController对应一个NameNode（同台机器）。
（5） ZooKeeper：系统调度器，提供二次开发接口；
运行时客户端先访问ZooKeeper得到当前可用的NameNode，再访问NameNode来完成他的请求。
（6）主备NameNode切换：
手动切换：根据需求命令切换
自动切换：基于ZooKeeper自动切换

Federation：

三个NameNode进行联邦，等价于三个集群同时工作，只是这里的三个集群共享了DataNode，可以根据业务分类将不同业务类型的数据交给不同的NameNode分别管理，这样解决文件数量多NameNode内存不够的问题。

注：Federation和高可用同时配置的话，相当于每个联邦的NameNode都有一个HA的结构图那个结构。

YARN：分布式资源管理系统
（1） ResourceManager：整个集群的资源管理和调度；
（2） ApplicationMaster：负责具体的一个应用程序相关事务，任务调度，任务监控，容错等；
（3） NodeManager：和DataNode同台机器（就近运算）都有一个NodeManager；
（4）为所有计算框架提供了统一接口，允许了多种计算框架同时运行在集群上：MapReduce，Storm，Spark

本文为博主原创，允许转载，但请声明原文地址：http://www.coselding.cn/article/2016/05/31/Hadoop 2.x理论知识/

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 2.x理论知识

本文为博主原创，允许转载，但请声明原文地址：http://www.coselding.cn/article/2016/05/31/Hadoop 2.x理论知识/Hadoop1.x的问题：（1） NameNode的单点故障问题；（2） NameNode的内存限制和可拓展性问题；（3） JobTracker访问过大，影响系统可拓展性；（4）难以
复制链接

扫一扫

专栏目录

Coselding CSDN认证博客专家 CSDN认证企业博客

码龄10年

33: 原创

25万+: 周排名

149万+: 总排名

11万+: 访问

: 等级

1499: 积分

26: 粉丝

28: 获赞

9: 评论

24: 收藏

私信

关注

热门文章

分类专栏

项目相关 14篇
开发工具 1篇
JavaEE 6篇
linux 9篇
JavaWeb 6篇
SSH 10篇
Java 19篇
数据库 6篇
基础知识 10篇
hadoop 7篇
ios 2篇
推送 2篇
APNs 1篇
面试 1篇
高可用 2篇
配置管理 1篇
分布式 1篇
微服务 1篇
Dubbo 1篇

最新评论

APNs入门学习和使用
星辰_mya: 中文翻译版 404
APNs入门学习和使用
星辰_mya: 很干货，学习了，谢谢分享
Pushy入门文档中文翻译
yuyurj: Native SSL provider not available; will use JDK SSL provider.我也是报这个错求助大神这是为啥
Pushy入门文档中文翻译
爱萝卜的狮子: 我按照您说的做了一遍最后他报了这个错 Native SSL provider not available; will use JDK SSL provider. 是因为jar包的问题吗
ZooKeeper配置和学习笔记
Tornado_Huang: 博主真棒，写的思路很清楚，代码也很详细，谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。