Hadoop学习笔记-DataNode

DataNode数据存在的形式

[root@h102 subdir0]# pwd
/opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1568640629-192.168.110.82-1622624666933/current/finalized/subdir0/subdir0
[root@h102 subdir0]# ll
total 48
-rw-rw-r--. 1 zyi zyi 1248 Jun  2 22:28 blk_1073741825
-rw-rw-r--. 1 zyi zyi   19 Jun  2 22:28 blk_1073741825_1001.meta
-rw-rw-r--. 1 zyi zyi 1013 Jun  3 03:46 blk_1073741854
-rw-rw-r--. 1 zyi zyi   15 Jun  3 03:46 blk_1073741854_1030.meta
-rw-rw-r--. 1 zyi zyi    7 Jun 11 07:34 blk_1073741861
-rw-rw-r--. 1 zyi zyi   11 Jun 11 07:34 blk_1073741861_1037.meta
-rw-rw-r--. 1 zyi zyi    6 Jun 11 07:34 blk_1073741862
-rw-rw-r--. 1 zyi zyi   11 Jun 11 07:34 blk_1073741862_1038.meta
-rw-rw-r--. 1 zyi zyi   14 Jun 11 07:37 blk_1073741864
-rw-rw-r--. 1 zyi zyi   11 Jun 11 07:37 blk_1073741864_1045.meta
-rw-rw-r--. 1 zyi zyi  304 Jul  1 04:25 blk_1073741865
-rw-rw-r--. 1 zyi zyi   11 Jul  1 04:25 blk_1073741865_1046.meta

在这里插入图片描述
blk_1073741825:数据
blk_1073741825_1001.meta:数据长度,校验和,时间戳

DataNode和NameNode

在这里插入图片描述

1)DataNode 启动后向 NameNode 注册,通过后,周期性(6 小时)的向 NameNode 上报所有的块信息。
在hdfs-default上面配置:
在这里插入图片描述
DN 扫描自己节点块信息列表的时间间隔(自查),默认 6 小时
在这里插入图片描述
2)心跳是每 3 秒一次,心跳返回结果带有 NameNode 给该 DataNode 的命令如复制块
数据到另一台机器,或删除某个数据块。如果超过 10 分钟没有收到某个 DataNode 的心跳,再给30秒,之后则认为该节点不可用。
在这里插入图片描述
TimeOut = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval
hdfs-site.xml 配置文件:
在这里插入图片描述

数据完整性

加粗样式
DataNode 节点保证数据完整性的方法。
(1)当 DataNode 读取 Block 的时候,它会计算 CheckSum。
(2)如果计算后的 CheckSum,与 Block 创建时值不一样,说明 Block 已经损坏。
(3)Client 读取其他 DataNode 上的 Block。
(4)常见的校验算法 crc(32),md5(128),sha1(160)
(5)DataNode 在其文件创建后周期验证 CheckSum。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值