GFS & HDFS

GFS与HDFS:分布式文件系统解析
本文深入探讨了Google的GFS和Hadoop的HDFS分布式文件系统。GFS采用64MB块大小,其Master节点管理元数据并使用轮询策略分配Chunk副本。写入过程中,数据直接推送到Chunk服务器。而HDFS的块大小为128MB,NameNode类似GFS Master,DataNode对应ChunkServer。HDFS在写操作上更严格,同一时间仅允许一个Client写入。此外,两者都遵循最终一致性原则,确保数据的短暂不一致最终会达到一致状态。

本文对GFS&HDFS进行简要整理

GFS

GFS参考网址

  • GFS架构
    GFS Architecture
  • GFS Master
    // 管理所有的文件元数据(存在于Memory中)
    // 对Chunk创建及管理:
    · 文件和Chunk命令空间(log持久化
    · 文件和Chunk对应关系(log持久化
    · 每个Chunk副本存放位置(轮询
  • GFS chunkserver
    · 存储Chunk的实际位置信息
    · Chunk以Linux文件形式存储在本地磁盘
  • 写入流程
    GFS Write Op
    · Client的数据沿着精心选择的Chunk服务器链推送
    · 由Primary Replica对写操作状态进行维护

HDFS

HDFS参考网址一 - Apache
HDFS参考网址二

  • HDFS架构
    HDFS Architecture
    · NameNode → GFS Master
    · DataNode → GFS ChunkServer

HDFS和GFS区别

  • 块大小
    · GFS: 64MB
    · HDFS: 128MB
  • 块位置
    · GFS: 轮询,不持久化
    · HDFS: 持久化
  • 写操作
    · GFS: 对同一文件,在同一时刻允许多个Client write/append
    · HDFS: 对同一文件,在同一时刻只允许一个Client write/append

最终一致性

一致性参考网址 - 知乎
· client通过异步从库读取时,若此异步从库还未复制主库内容,则client会看到过时信息;但该不一致是暂态,因为异步从库最终会与主库保持一致。(这成为最终一致性)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值