还不知道HDFS 深入理解 和 读写流程吗?

HDFS 深入 理解

一. namenode和datanode的功能

namenode: 管理文件的元数据

处理来自客户端的请求

datanode: 保存数据本身

少量的元数据: 块的长度, 校验和, 时间戳

二. namenode从集群中的每个datanode周期性的接受心跳信息和块报告

心跳信息

心跳是每3秒一次

心跳返回结果带有NameNode给该DataNode的命令如(复制块,删除)

如果超过10分钟没有收到某个DataNode的心跳,则认为该节点不可用。

块报告

DataNode启动后向NameNode注册,通过后,

周期性(1小时)的向NameNode上报所有的块信息。

三. 数据块损坏处理

当DataNode读取block的时候,它会计算checksum,与block创建时值不一样,说明该block已经损坏。

Client读取其它DN上的block。

NameNode标记该块已经损坏,然后复制block达到预期设置的文件备份数

DataNode 在其文件创建后三周验证其checksum

四、HDFS的读写流程

还不知道HDFS 深入理解 和 读写流程吗?就看这一篇就够了

 

还不知道HDFS 深入理解 和 读写流程吗?就看这一篇就够了

 

还不知道HDFS 深入理解 和 读写流程吗?就看这一篇就够了

 

还不知道HDFS 深入理解 和 读写流程吗?就看这一篇就够了

 

HDFS的高可用?

HDFS的高可用指的是HDFS持续对各类客户端提供读、写服务的能力,因为客户端对HDFS的读、写操作之前都要访问name node服务器,客户端只有从name node获取元数据之后才能继续进行读、写。所以HDFS的高可用的关键在于name node上的元数据持续可用。

HDFS的运行机制?

HDFS集群中的节点分为两种角色:

一种角色负责管理整个集群的元数据,是名称节点(name node);

另一种角色负责存储文件数据块和管理文件数据块,是数据节点(datanode)

关注 转发点赞是个好习惯哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值