DataNode掉线判定时限

最新推荐文章于 2023-08-07 16:14:11 发布

墨染百城

最新推荐文章于 2023-08-07 16:14:11 发布

阅读量1.2k

点赞数

分类专栏：大数据框架 Hadoop 文章标签： DataNode 掉线时间

本文链接：https://blog.csdn.net/mrbcy/article/details/56063605

版权

大数据框架同时被 2 个专栏收录

31 篇文章 0 订阅

订阅专栏

Hadoop

29 篇文章 0 订阅

订阅专栏

DataNode职责

存储管理用户的文件块数据
定期向namenode汇报自身所持有的block信息（通过心跳信息上报）
（这点很重要，因为，当集群中发生某些block副本失效时，集群如何恢复block初始副本数量的问题）

配置文件如下：

<property>
    <name>dfs.blockreport.intervalMsec</name>
    <value>3600000</value>
    <description>Determines block reporting interval in milliseconds.</description>
</property>

DataNode掉线判定时限

datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。

如果定义超时时间为timeout，则超时时长的计算公式为：

timeout = 2 * heartbeat.recheck.interval + 10 * dfs.heartbeat.interval

而默认的heartbeat.recheck.interval 大小为5分钟，dfs.heartbeat.interval默认为3秒。

需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.interval的单位为秒。

所以，举个例子，如果heartbeat.recheck.interval设置为5000（毫秒），dfs.heartbeat.interval设置为3（秒，默认），则总的超时时间为40秒。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

墨染百城

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

HDFS掉线时限参数设置

Ele_sorriu的博客

10-14

2万+

掉线时限参数设置 datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout，则超时时长的计算公式为： timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval。而默认的dfs.namenode.heart

《HDFS 1》--HDFS的简介 / 设计思想、HDFS体系结构、DataNode掉线判断时限参数、查看镜像文件和日志文件

yk_3215123的博客

05-07

295

1、HDFS的简介/设计目标 1）硬件错误硬件组件错误是常态，而非异常情...

参与评论您还未登录，请先登录后发表或查看评论

Hadoop HDFS | DataNode工作机制 | 数据完整性 | 掉线时限参数设置

lesileqin的博客

04-15

744

文章目录一、DataNode工作机制二、数据完整性三、掉线时限参数设置一、DataNode工作机制直接看一张图：它的工作流程是：当DataNode启动后，必须向NameNode汇报自己的块信息，然后定期（6个小时）扫描、上报自己所有块的信息。块信息包括：数据、数据长度、校验和（即数据完整性）、时间戳每个DataNode必须定期向NameNode汇报说：我还活着。这个过程叫做心跳，心跳每三秒一次；如果超过10分钟+30秒 NameNode没有收到DataNode的心跳，就会认为DataNode

HDFS中DataNode工作机制

weixin_30627341的博客

07-24

1.DataNode工作机制 1）一个数据块在datanode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据（包括数据块的长度，块数据的校验和，以及时间戳）。 2）DataNode启动后向namenode注册，通过后，周期性（1小时）的向namenode上报所有的块信息。 3）心跳是每3秒一次，心跳返回结果带有namenode给该datanode的命令如复...

Java大数据-Hadoop-HDFS- DN （DataNode）工作机制、数据完整性、掉线时限参数设置

godkzz的博客

12-21

362

一、DataNode （1）一个数据块在 DataNode 上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。（2）DataNode 启动后向 NameNode 注册，通过后，周期性（6 小时）的向 NameNode 上报所有的块信息。 DN 向 NN 汇报当前解读信息的时间间隔，默认 6 小时 <property> <name>dfs.blockreport.intervalMsec</.

DataNode工作机制（心跳机制，掉线判断时限参数）（六）

May_J_Oldhu的博客

12-09

1328

DataNode工作机制数据节点。就是Slave，实际存储数据块的节点，Namenode下达命令，DataNode执行实际操作。 1、存储管理用户的文件块数据 2、定期向 namenode 汇报自身所持有的 block 信息（通过心跳信息上报）一个数据块在DataNode上以文件形式存储在对应服务器的磁盘上。包括两个文件，一个是数据本身，一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。 DataNode 启动后向 NameNode 注册，通过后，周期性（1 小时）的

第6章 DataNode

留不住斜阳的博客

06-02

534

HDFS DataNode工作机制

namenode和datanode工作机制_namenode和datanode的工作机制

weixin_32950005的博客

12-29

954

namenode工作机制1、namenode职责(1)负责客户端请求的响应(2)元数据的管理(查询，修改)2、元数据管理namenode对数据的管理采用了三种存储形式：内存元数据(NameSystem)磁盘元数据镜像文件数据操作日志文件(可通过日志运算出元数据)2.1元数据存储机制内存中有一份完整的元数据(内存meta data)磁盘有一个“准完整”的元数据镜像(fsimage)文件(在namen...

12_尚硅谷大数据之HDFS_DataNode1

08-03

本文将深入探讨HDFS中的DataNode及其相关知识点，包括DataNode的工作机制、数据完整性、掉线时限参数设置以及如何服役新数据节点。 6.1 DataNode工作机制 DataNode是HDFS的基石，负责实际的数据存储。每个DataNode...

DataNode（面试开发重点1）

翁老师的教学团队

03-24

469

1 DataNode工作机制》什么是心跳机制心跳机制是定时发送一个自定义的结构体(心跳包)，让对方知道自己还活着，以确保连接的有效性的机制。》心跳机制有什么用？检测死连接举个例子，A客户连着B服务器，但实际上是A->中间的网络设备C->B，如果是A到C断了，实际上B是无法知道的，因为B来说A的连接（就是C）还连着，心跳机制就解决了这个问题》DataNode工作机制 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pWikjdzL-161657233867

黑猴子的家：DataNode之掉线时限参数设置

黑猴子的博客

09-25

219

datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout，则超时时长的计算公式为： timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs...

HDFS 在上传文件的时候，如果其中一个 DataNode 突然挂掉了怎么办？

想练武，就得下功夫

07-21

502

HDFS 在上传文件的时候，如果其中一个 DataNode 突然挂掉了怎么办？

HDFS在上传文件的时候，如果其中一个DataNode突然挂掉了怎么办？

星空下的那个人影

04-29

2850

客户端上传文件时与DataNode建立pipeline管道，管道正向是客户端向DataNode发送的数据包，管道反向是DataNode向客户端发送ack确认，也就是正确接收到数据包之后发送一个已确认接收到的应答；当DataNode突然挂掉了，客户端接收不到这个DataNode发送到ack确认，客户端会通知NameNode，NameNode检查该块的副本与规定的不符，NameNode会通知DataNode去复制副本，并将挂掉的DataNode作下线处理，不再让它参与文件上传与下载。 ...

DataNode内部的调度线程

weixin_30654419的博客

08-07

190

首先DataNode自身就是一个Runnable的实现，也就是说DataNode是以一个单独的线程在运行着的。 DataXceiverServer，DataXceiver DataNode在Block的数据流读写方面都交给了DataXceiverServer，DataXceiverServer也是运行在一个单独的线程当中，在主循环当中阻塞监听dfs.datanode.ad...

hadoop的datanode异常结束

joomlaer的专栏

11-18

1万+

集群datanode节点挂掉一个。错误如下: 2013-11-18 02:01:13,730 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: DatanodeRegistration(192.168.1.190:50010, storageID=DS-155659652-192.168.1.190-50010-138361974046

CLOSE_WAIT状态的原因与解决方法