Hadoop(HDFS)

HDFS是HadoopDistributedFileSystem的缩写,是一种用于存储大规模数据的分布式文件系统。它具有高容错性,通过数据自动保存多个副本来保证可靠性。HDFS适合处理一次性写入、多次读出的场景,但不支持低延迟数据访问和文件的随机修改。系统由NameNode(主节点)管理文件命名空间和数据块映射,DataNode(从节点)存储实际数据,而Client负责文件操作和与NameNode、DataNode的交互。
摘要由CSDN通过智能技术生成

第1章 HDFS概述

1.1 HDFS产出背景定义

1.1.1 HDFS 产生背景
随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统
管理的磁盘中,但是不方便管理和维护,迫切 需要一种系统来管理多台机器上的文件 ,这就是
分布式文件管理系统。 HDFS 只是分布式文件管理系统中的一种。
1.1.2 HDFS 定义
HDFS Hadoop Distributed File System ),它是一个文件系统 ,用于存储文件,通过目录树
来定位文件; 其次,它是分布式的, 由很多服务器联合起来实现其功能,集群中的服务器有各
自的角色。
HDFS 的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。 适合用来做数
1.2 HDFS 优缺点
 
1.2.1 优点
1 )高容错性
(1 )数据自动保存多个副本。它通过增加副本的形式,提高容错性。
 
(2)某一个副本丢失以后,它可以自动恢复。
 
2 )适合处理大数据
(1)数据规模:能够处理数据规模达到 GB TB 、甚至 PB 级别的数据
(2)文件规模:能够处理 百万 规模以上的 文件数量 ,数量相当之大。
3 )可 构建在廉价机器上 ,通过多副本机制,提高可靠性。
 
1.2.2 缺点
1 不适合低延时数据访问 ,比如毫秒级的存储数据,是做不到的。
2 无法高效的对大量小文件进行存储。
1 )存储大量小文件的话,它会占用 NameNode 大量的内存来存储文件目录和块信息。这样是不可取的,因为NameNode 的内存总是有限的;
(2)小文件存储的寻址时间会超过读取时间,它违反了 HDFS 的设计目标。
3 )不支持并发写入、文件随机修改。
(1)一个文件只能有一个写,不允许多个线程同时写;
(2) 仅支持数据 append (追加), 不支持文件的随机修改。
 
1.3 HDFS 组成架构
 
1 NameNode (nn):就是 Master ,它 是一个主管、管理者。
(1)管理 HDFS 的名称空间;
(2)配置副本策略;
(3)管理数据块( Block )映射信息;
(4)处理客户端读写请求。
2 DataNode :就是 Slave NameNode 下达命令,DataNode 执行实际的操作。
(1)存储实际的数据块;
(2)执行数据块的读 / 写操作。
 
3 Client :就是客户端。
1 )文件切分。文件上传 HDFS 的时候, Client 将文件切分成一个一个的 Block ,然后进行上传;
(2)与 NameNode 交互,获取文件的位置信息;
(3)与 DataNode 交互,读取或者写入数据;
(4) Client 提供一些命令来管理 HDFS ,比如 NameNode 格式化;
(5) Client 可以通过一些命令来访问 HDFS ,比如对 HDFS 增删查改操作;
4 Secondary NameNode :并非 NameNode 的热备。当 NameNode 挂掉的时候,它并不
能马上替换 NameNode 并提供服务。
(1)辅助 NameNode ,分担其工作量,比如定期合并 Fsimage Edits ,并推送给 NameNode
(2)在紧急情况下,可辅助恢复 NameNode

1.4 HDFS文件块大小

HDFS 中 的 文 件在 物 理 上 是 分块 存 储 ( Block ) , 块 的 大 小 可 以通 过 配 置 参数
( dfs.blocksize) 来规定, 默认大小在 Hadoop2.x 版本中是 128M ,老版本中是 64M
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

the uzi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值