HDFS 面试题

1. 如何理解 Hadoop

  1. 广义上 Hadoop 是指与 Hadoop 相关的大数据生态圈, 包括 hive, spark, hbase 等
  2. 狭义上 Hadoop 是指 Apache 的开源框架.有三个核心组件:
    hdfs: 分布式文件存储系统
    yarn: 分布式资源管理调度平台
    MR: 分布式计算引擎

2. HDFS 整体架构

  1. Client: 客户端
    (1) 文件切分
    (2) 与 NameNode 交互, 获取文件的位置信息
    (3) 与 DataNode 交互, 读取或者写入数据
    (4) Client 提供一些命令来管理 HDFS

  2. NameNode: Master
    (1) 管理 HDFS 的名称空间,
    (2) 管理数据块的映射信息
    (3) 配置副本策略(默认是 3)
    (4) 处理客户端读写请求

  3. DataNode: Slave
    (1) 存储实际的数据块
    (2) 执行数据块的读写操作

  4. SecondaryNameNode:
    (1) 辅助 NameNode, 分担其工作量
    (2) 定期合并 Fsimage 和 Edits , 并推送给 NameNode
    (3) 在紧急情况下, 可以辅助回复 NameNode

3. HDFS 写数据流程

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值