Hadoop 之 HDFS HA 原理和服务

最新推荐文章于 2022-12-27 15:19:47 发布

我承包的鱼塘

最新推荐文章于 2022-12-27 15:19:47 发布

阅读量492

点赞数

分类专栏：大数据Spark 文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39594447/article/details/86601080

版权

大数据Spark 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

Hadoop HDFS:

HDFS在hadoop中是一个分布式文件存储系统，hdfs非常重要，它是大数据的基石，像hbase,hive等都是依赖于它。

2. HDFS系统有两种服务

2.1 Namenode:

这个服务管理着文件的元数据，

2.2 Datanode:

这个服务是存储文件的数据的服务，一般在多个节点开启这个服务

读文件:

1. 向Namenode查询文件的存储位置

2. 根据第一步获取的文件位置，向datanode获取数据

写文件与读文件流程类似

Hadoop HDFS HA:

Namenode 中主要由两部分构成 Edits, FSimage, Edits存放在时时的元数据，在做HA时，需要开启两个Namenode服务

一个Namenode 是active状态，另一Namenode是standby状态，如果active状态的Namenode出现故障，不能对外提供服务，

HA 能自动将另一台standby状态的Namenode服务，切换成active状态，并对外提供服务,这个状态的自动切换时通过zookeeper来完成的(两个namenode开启zkfc服务)。这时必须保证两个namenode的数据时同步的，保证两个namenode的数据同步，是开启多个journalnode 服务，namenode 会时时同步数据到journalnode(active namenode 会在写入的同时，也会写入到journalnode，standby namenode会时时同步journalnode的数据)

所以我们在开始启动服务时:

首先要启动journalnode服务

2. 格式化namenode,并开启namenode 服务

3. standby namenode，首先同步namenode节点数据，再开启namenode服务

4. 你可以先停掉hdfs服务，初始化zkfc

5. 可以调用dfs-start.sh 开启hdfs相关的服务，但是两个namenode节点上的zkfc是需要自己手动启动的。

参考配置文件: https://github.com/wujianqiangwjq/hadoop_cluster_configuration/hadoop

我承包的鱼塘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop 之 HDFS HA 原理和服务

Hadoop HDFS: HDFS在hadoop中是一个分布式文件存储系统，hdfs非常重要，它是大数据的基石，像hbase,hive等都是依赖于它。 2. HDFS系统有两种服务 2.1 Namenode: 这个服务管理着文件的元数据，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。