一、DataNode工作机制

最新推荐文章于 2023-03-05 21:43:40 发布

Alfred_XiaJL

最新推荐文章于 2023-03-05 21:43:40 发布

阅读量263

点赞数

分类专栏： Hadoop 文章标签： hadoop hdfs big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43553142/article/details/121713897

版权

Hadoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.DataNode工作机制及存储

HDFS分布式文件系统也是一个主从架构
主节点是namenode，负责管理整个集群以及维护集群的元数据信息
从节点datanode，主要负责文件数据存储

在这里插入图片描述

2. datanode工作机制

在这里插入图片描述
-1）一个数据块在datanode上以文件形式存储在磁盘上，包括两个文件

一个是数据本身
一个是元数据包括数据块的长度，块数据的校验和，以及时间戳。
hdfs-site.xml中指定了数据存储的路径
2）DataNode启动后向namenode注册，通过后，周期性（6小时）的向namenode上报所有的块信息。
3）心跳是每3秒一次
- 心跳返回结果带有namenode给该datanode的命令如复制块数据到另一台机器，或删除某个数据块。
- 如果超过10分钟没有收到某个datanode的心跳，则认为该节点不可用
4）集群运行中可以安全加入和退出一些机器
3.datanode的数据完整性
1. 当客户端向hdfs写数据时
- 会计算数据的校验和，以此保证数据通过网络传输，到达datanode后，没有丢失数据
2）当DataNode读取block的时候
- 它会计算checksum
- 如果计算后的checksum，与block创建时值不一样，说明block已经损坏
- client读取其他DataNode上的block

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一、DataNode工作机制

浅谈Hadoop中DataNode的工作机制。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。