Hadoop集群搭建实验(4) _HDFS Federation联邦集群部署

最新推荐文章于 2025-08-14 19:57:07 发布

原创

最新推荐文章于 2025-08-14 19:57:07 发布 · 1.2k 阅读

4 ·

CC 4.0 BY-SA版权

参考文章：

https://blog.csdn.net/pengxiaozhen1111/article/details/88095914

https://blog.csdn.net/wild46cat/article/details/53423472

https://blog.csdn.net/qq_39532946/article/details/76461110

https://my.oschina.net/cloudcoder/blog/880812

https://blog.csdn.net/u014679456/article/details/81486863

https://blog.csdn.net/liuzhuang2017/article/details/81630116

什么是NameNode Fedaeration联邦（HDFS联邦，Hadoop联邦）？

单个 NameNode 的集群架构使得 HDFS 在集群扩展性和性能上都有潜在的问题，当集群大到一定程度后，NameNode 进程用于存放元数据的内存可能会达到上百 G，NameNode 成为了性能瓶颈。为了解决NameNode内存不足导致无法存放更多元数据的瓶颈，提出了 NameNode 的水平扩展方案： HDFS Federation。Federation 中文意思为联邦,联盟，本质上是 NameNode 的 Federation,也就是会有多个NameNode。多个 NameNode 也意味着有多个 NameSpace(命名空间)

NameNode内存瓶颈：数据量越大，元数据也越多，内存有限，承载不了

NameNodeCPU瓶颈：业务量大，客户端多，高并发，读写请求，响应不了

实验目标：部署一个小型的HDFS联邦集群，用于教学演示
环境要求：虚拟机VirtualBox 操作系统 Centos7 hadoop版本 hadoop-2.6.0-cdh5.7.0

集群规划：

主机ip	主机名	集群中的角色	作用
192.168.56.9	master1	NameNode	存放电影应用的元数据
192.168.56.10	master2	NameNode	存放音乐应用的元数据
192.168.56.11	slave1	DataNode	存储实际数据的公共节点
192.168.56.12	slave2	DataNode	存储实际数据的公共节点