Hadoop入门之HDFS

一、HDFS的概念

HDFS是一个分布式存储系统

二、HDFS的设计目标

1.自动检测硬件错误

2.流式访问数据

3.尽量采用转移计算

4.使用简单一致性数据模型

5.异构平台可移植性

三、HDFS的三个基本概念

1.Block(数据块)

文件分块存储,每个快默认64MB,是文件存储的逻辑单元。

2.NameNode(主节点)

是管理节点,存放元数据,包括文件与数据的映射表和块与节的映射表。

3.DataNode(数据节点)

是工作节点,存放数据块。

四、HDFS的数据管理策略

1.每个数据有三个副本,两份存在一个机架上,一份存在另一个机架上。

2.心跳检测,DataNode定期向NameNode发送心跳信息

3.主节点备份,使用Secondary NameNode

五、HDFS的适用性和局限性

1.适合批量读写,吞吐量高。

2.不适合交互式应用

3.适合一次写入多次读取

4.不适合多用户并发写相同文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值