Hadoop架构介绍——HDFS的体系结构

Hadoop的HDFS设计目标包括处理硬件故障、流式数据访问和数据一致性。系统采用Master-Slave模式,NameNode作为中心服务器管理文件系统,而DataNode分布在全球各地存储并检索数据块。每个DataNode保存文件的3个副本,其中2个在同一机架,另一个在不同机架。元数据通过Fsimage和EditLog备份,NameNode结合两者更新内存中的元数据。HDFS使用TCP协议进行节点间通信,DataNode每3秒发送心跳,10次心跳后报告数据块信息。数据写入和读取流程涉及NameNode和DataNode的交互,确保数据可靠性和可用性。
摘要由CSDN通过智能技术生成

设计目标:

-(硬件故障是常态,而非偶然)自动快速检测应对硬件错误

-流式访问数据(数据批处理)

-转移计算比移动数据本身更划算(减少数据传输)

-简单的数据一致性模型(一次写入,多次读取的文件访问模型)

-异构平台可移植


HDFS体系结构


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值