Hadoop 两种环境下的checkpoint机制

最新推荐文章于 2024-07-03 14:44:32 发布

dingqiu6346

最新推荐文章于 2024-07-03 14:44:32 发布

阅读量171

点赞数

文章标签：大数据

原文链接：http://www.cnblogs.com/TiePiHeTao/p/9959615e239ec4e5652468d4a00b82e5.html

版权

伪分布式环境：

HA环境checkpoint机制

配置了HA的HDFS中，有active和standby namenode两个namenode节点。他们的内存中保存了一样的集群元数据信息，因为standby namenode已经将集群状态存储在内存中了，所以创建检查点checkpoint的过程只需要从内存中生成新的fsimage。

详细过程如下：（standby namenode=SbNN， activenamenode=ANN）

1. SBNN查看是否满足创建检查点的条件：

（1）距离上次checkpoint的时间间隔 >= ${dfs.namenode.checkpoint.period}
（2） Edits中的事务条数达到${dfs.namenode.checkpoint.txns}限制
这两个条件任何一个被满足了，就触发一次检查点创建。

2. SbNN将内存中当前的状态保存成一个新的文件，命名为fsimage.ckpt_txid。其中txid是最后一个edit中的最后一条事务的ID（transaction ID）。然后为该fsimage文件创建一个MD5文件，并将fsimage文件重命名为fsimage_txid。

3. SbNN向active namenode发送一条HTTP GET请求。请求中包含了SbNN的域名，端口以及新fsimage的txid。

4. ANN收到请求后，用获取到的信息反过来向SbNN再发送一条HTTP GET请求，获取新的fsimage文件。这个新的fsimage文件传输到ANN上后，也是先命名为fsimage.ckpt_txid，并为它创建一个MD5文件。然后再改名为fsimage_txid。fsimage过程完成。

转载于:https://www.cnblogs.com/TiePiHeTao/p/9959615e239ec4e5652468d4a00b82e5.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dingqiu6346

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Hadoop2.0 HA的checkpoint过程

Amber_amber的专栏

07-22

7355

hdfs将文件系统的元数据信息存放在fsimage和一系列的edits文件中。在启动HDFS集群时，系统会先加载fsimage，然后逐个执行所有Edits文件中的每一条操作，来获取完整的文件系统元数据。 Edits & fsimage文件 HDFS的存储元数据是由fsimage和edits文件组成。fsimage存放上次checkpoint生成的文件系统元数据，Edits存放文件系统操

《Hadoop管理一》checkpoint原理和过程

weixin_30823683的博客

07-25

235

理解这两个概念，对于理解Hadoop是如何管理备份，Secondary Namenode、Checkpoint Namenode和Backup Node如何工作的很重要。 fsimage：文件是文件系统元数据的一个永久性检查点，包含文件系统中的所有目录和文件idnode的序列化信息。 edits：文件系统的写操作首先把它记录在edit中将文件系统个元数据操作分开操作，是为了提升内存...

参与评论您还未登录，请先登录后发表或查看评论

hadoop的checkpoint

weixin_44273391的博客

09-20

611

hadoop的checkpoint SecondaryNameNode 通过定时查询 namenode上的edit logs 来保证 fsimage的及时更新时刻复制 active的Namenode工作节点的快照。合并namenode 的 edit log 合并到 fsimage上 1.定时获取active状态的namenode节点的 edit logs 并更新到 fsimage [S...

Hadoop原理之checkpoint机制

LOGAN'S BLOG

08-22

2682

一、什么是checkpoint？简单来说，若不使用HA时，hadoop的checkpoint机制就是主节点的元数据备份机制，通过Secondary Namenode，每隔一段时间将Name Node的元数据更新并备份，然后返回fsimage给Name Node，供其下次启动时读取二、具体原理原理图首先，有一个主节点Name Node（NN），同时还有一个Secondary NameNode（SNN），可将SNN看作

Hadoop NameNode故障转移：Checkpoint的决定性作用

![Hadoop NameNode故障转移...NameNode的设计理念和实现机制是整个Hadoop系统稳定性和扩展性的关键。在这一章中，我们会详细探讨NameNode的工作原理、元数据管理方式以及它在HDFS中所扮演的核心角色。此外，我们还将介

hadoop合并日志_hadoop四大机制两大核心

weixin_39812465的博客

12-18

122

hdfs的4大机制，2大核心hdfs提供的是高容错性的分布式数据存储方案一、四大机制hdfs的四大机制包括心跳机制、安全模式、机架策略和负载均衡。hadoop集群start-dfs.sh启动集群时，各进程启动的顺序：namenodedatanodesecondarynamenode1.1 心跳机制集群节点之间必须做时间同步，namenode是集群的老大，负责集群上任务的分工，如果要进行分工，则必须...

Hadoop Checkpoint与其他HDFS组件：交互机制深入理解

![Hadoop Checkpoint与其他HDFS组件：交互机制深入理解](https://img-blog.csdnimg.cn/20191230155753688.png?x-oss-process=image/watermark,type...Hadoop Checkpoint是Hadoop系统中一种核心机制，它确保文件系统的元

【数据无虞】Hadoop Checkpoint与数据完整性的守护机制

[【数据无虞】Hadoop Checkpoint与数据完整性的守护机制](https://media.geeksforgeeks.org/wp-content/uploads/20200717200258/Reducer-In-MapReduce.png) # 1. Hadoop Checkpoint的概念与必要性 ## Hadoop ...

【系统可靠性提升】Hadoop数据备份与Checkpoint策略

![hadoop的checkpoint流程]... Hadoop数据备份与Checkpoint策略概述在现代的数据处理框架中，Hadoop凭借其可扩展性和容错性在大数据存储领域扮演着核心角色。然而，即使是强大

Hadoop中NameNode的主从之间的CheckPoint机制

weixin_43469563的博客

03-15

458

首先我们要知道,在NameNode中有三种数据的形式: 内存元数据:内存中有一份完整的元数据] 磁盘元数据镜像文件FSImage:磁盘有一个"准完整"的元数据镜像文件数据操作日志文件edit:用于衔接内存metadata和磁盘元数据镜像fsimage之间的日志当客户端对hdfs的文件进行新增或者修改操作的时候,操作首先会被记入到edits日志文件中,当客户端操作成功后,相应的元数据会...

[hadoop] 各节点职责｜ checkpoint ｜安全模式｜读写流程｜小文件｜安全模式 | NameNode启动流程

胖胖的博客

03-02

5722

一HDFS 什么是HDFS？当数据集大小超过一台独立的物理计算机的存储能力时,就有必要对它进行分区并存储到若干台独立的计算机上. 管理网络中跨多台计算机存储的文件系统成为分布式文件系统. 该系统架构于网络之上,势必会引入网络编程的复杂性.因此分布式文件系统比普通文件系统更为复杂. 二内部原理 1.NameNode职责 Name 2.NameNode元数据 3.SecondaryNameNode职责 4.checkpoint机制 ...

hadoop各种流程

zzc_while_go的博客

11-14

819

元数据合并流程 HDFS的读写过程 shuffle过程 job提交流程元数据合并流程 CheckPoint edits:日志的元数据 fsImage ：镜像的元数据 1）snn会向namenode发送元数据是否合并的检查 1min检查一次 2）namenode需要元数据合并会向snn进行相应 3）snn向namenode发送元数据合并的请求 4）namenode将正在编辑的元数据的日志...

Hadoop Ha 检查点原理

那又怎样？的博客

12-27

1330

转载来自：https://blog.csdn.net/amber_amber/article/details/47003589 hdfs将文件系统的元数据信息存放在fsimage和一系列的edits文件中。在启动HDFS集群时，系统会先加载fsimage，然后逐个执行所有Edits文件中的每一条操作，来获取完整的文件系统元数据。 Edits & fsimage文件 HDFS的存储元数据...

黑猴子的家：Hadoop HA模式下Checkpointing过程分析

黑猴子的博客

09-05

492

在HA模式下checkpoint过程由StandBy NameNode来进行，以下简称为SBNN，Active NameNode简称为ANN。　　HA模式下的edit log文件会同时写入多个JournalNodes节点的dfs.journalnode.edits.dir路径下，JournalNodes的个数为大于1的奇数，类似于Zookeeper的节点数，当有不超过一半的JournalNode...

Hadoop2.0 HA安装完整版——Hadoop2.7.3

@羲凡—只为更好的活着

01-15

1686

@羲凡——只为了更好的活着 Hadoop2.0 HA安装完整版——Hadoop2.7.3 Hadoop从2008年发布，到现在已经11个年头了。Hadoop安装是任何一个大数据开发或运维人员都必须掌握的。本文尽可能详细的介绍hadoop 高可用的安装并对参数做一定的介绍(用 deplab 用户安装)。hadoop的安装都非常类似，无论是hadoop2.0版本还是hadoop3.0版本。此文中选择H...

【大数据Hadoop】HDFS-HA模式下Checkpointer机制代码分析

如切如磋，如琢如磨，臻于至善。

03-26

898

Namenode一方面为了提供客户端的响应速度，另外一方面为了提高集群的可靠稳定性（断电后数据不丢失），所以在内存中存储全量的文件系统元数据，定期的将元数据信息持久化到磁盘中(fsimage_0000000000000102359)，对于此持久化时间点后产生的元数据操作（创建，修改，删除等），都会记录到edits_xxx-xxx文件中，对于正在执行元数据操作过程中的操作，会记录在一个edits_inprogress_xxxx文件中。此过程就是将 fsImage 上传给 active namenode节点。

HDFS的Checkpoint 执行流程