HDFS介绍

什么是HDFS

它是一个文件系统,通过目录树的方式存储文件,分布式存储

HDFS的特点

优点

  1. 高容错,自动保存多副本
  2. 适合处理大数据
  3. 可以构建在廉价的机器上,通过多副本复制机器

缺点

  1. 不适合低延时数据访问
  2. 无法高效的存储小文件
  3. 不支持并发写入, 且不支持修改,只支持追加

HDFS组织架构

在这里插入图片描述

  1. NameNode:管理这个节点的所有信息
    a. 管理HDFS的名称空间
    b. 配置副本策略
    c. 管理数据块(Block)映射信息
    d. 处理客户端读写请求
  2. DataNode:由NameNode下达命令,DataNode去执行
    a. 存储数据
    b. 执行数据块的读写操作
  3. 客户端
    a. 文件切分,按照NameNode的文件块(128mb)去切分
    b. 与NameNode交互获取文件位置
    c. 与DataNode交互,读写文件
    d. 提供一系列命令操作HDFS

HDFS文件块大小

  1. 太小:会增加寻址时间
  2. 太大:不利于后期的并发运算
  3. 取决于传输速率(一致)

HDFS读写数据流程

  1. 写数据
    在这里插入图片描述
  2. 读数据
    在这里插入图片描述

NN和2NN的工作原理

在这里插入图片描述
Fsimage文件:保存当前磁盘中文件的镜像
edits文件:对数据进行的追加操作
seen文件:当前对应edits文件的版本

DataNode工作原理

存储内容:数据块信息,校验和,时间戳
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值