HDFS 面试题

最新推荐文章于 2024-05-27 09:55:10 发布

YanLzh_MAlone

最新推荐文章于 2024-05-27 09:55:10 发布

阅读量311

点赞数

分类专栏：面试资料

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35199832/article/details/107428818

版权

HDFS

1. 如何理解 Hadoop
2. HDFS 整体架构
3. HDFS 写数据流程
4. HDFS 读数据流程
5. HDFS 副本存放机制/机架感知 (写数据时)
6. HDFS 数据完整性如何保证
7. DataNode 的工作机制
8. HDFS 中大量小文件带来的问题及解决方法

1. 如何理解 Hadoop

广义上 Hadoop 是指与 Hadoop 相关的大数据生态圈, 包括 hive, spark, hbase 等
狭义上 Hadoop 是指 Apache 的开源框架.有三个核心组件:
hdfs: 分布式文件存储系统
yarn: 分布式资源管理调度平台
MR: 分布式计算引擎

2. HDFS 整体架构

Client: 客户端
(1) 文件切分
(2) 与 NameNode 交互, 获取文件的位置信息
(3) 与 DataNode 交互, 读取或者写入数据
(4) Client 提供一些命令来管理 HDFS
NameNode: Master
(1) 管理 HDFS 的名称空间,
(2) 管理数据块的映射信息
(3) 配置副本策略(默认是 3)
(4) 处理客户端读写请求
DataNode: Slave
(1) 存储实际的数据块
(2) 执行数据块的读写操作
SecondaryNameNode:
(1) 辅助 NameNode, 分担其工作量
(2) 定期合并 Fsimage 和 Edits , 并推送给 NameNode
(3) 在紧急情况下, 可以辅助回复 NameNode

3. HDFS 写数据流程

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
HDFS 面试题

HDFS1. 如何理解 Hadoop2. HDFS 整体架构3. HDFS 写数据流程4. HDFS 读数据流程5. HDFS 副本存放机制/机架感知 (写数据时)6. HDFS 数据完整性如何保证7. DataNode 的工作机制8. HDFS 中大量小文件带来的问题及解决方法1. 如何理解 Hadoop广义上 Hadoop 是指与 Hadoop 相关的大数据生态圈, 包括 hive, spark, hbase 等狭义上 Hadoop 是指 Apache 的开源框架.有三个核心组件:hdfs:
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。