前言
学习HDFS知识
一、HDFS是什么?
HDFS是一个分布式文件系统,适合一次写入多次读出的场景。
二、优缺点
1.优点
- 高容错性(多副本)
- 适合处理大数据
- 可构建在廉价机器上
2.缺点
- 不适合低延时数据访问,如毫秒级存储数据做不到
- 无法高效对大量小文件进行存储
- 不支持并发写入,随机修改
三、HDFS组成架构
- Namenode:管理元数据(块信息、物理位置信息、副本数量等),处理客户端请求。管理者角色。
- Secondary Namenode:进行元数据定期合并,备份。
- Datanode:实际存储数据块,与客户端进行交互(读写数据)
- Client:hdfs对外提供的接口,api。