一、HDFS 概述

一、HDFS概述


目录

1、 HDFS 产出背景及定义

1.1 HDFS 产生背景

1.2 HDFS 定义

2、HDFS 优缺点

 3 、HDFS 组成架构

4、 HDFS 文件块大小(面试重点)


1、 HDFS 产出背景及定义

1.1 HDFS 产生背景

        随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系
统管理的磁盘中,但是不方便管理和维护,迫切 需要一种系统来管理多台机器上的文件 ,这
就是分布式文件管理系统。 HDFS 只是分布式文件管理系统中的一种。

1.2 HDFS 定义

        HDFS( Hadoop Distributed File System ),它是一个文件系统 ,用于存储文件,通过目
录树来定位文件; 其次,它是分布式的 ,由很多服务器联合起来实现其功能,集群中的服务
器有各自的角色。
        HDFS 的使用场景:适合一次写入,多次读出的场景。 一个文件经过创建、写入和关闭
之后就不需要改变。

2、HDFS 优缺点

 

 3 、HDFS 组成架构

3 Client :就是客户端。
1 )文件切分。文件上传 HDFS 的时候, Client 将文件切分成一个一个的 Block ,然后进行上传;
2 )与 NameNode 交互,获取文件的位置信息;
3 )与 DataNode 交互,读取或者写入数据;
4 Client 提供一些命令来管理 HDFS ,比如 NameNode 格式化;
5 Client 可以通过一些命令来访问 HDFS ,比如对 HDFS 增删查改操作;
4 Secondary NameNode :并非 NameNode 的热备。当 NameNode 挂掉的时候,它并不
能马上替换 NameNode 并提供服务。
1 )辅助 NameNode ,分担其工作量,比如定期合并 Fsimage Edits ,并推送给 NameNode
2 )在紧急情况下,可辅助恢复 NameNode

4、 HDFS 文件块大小(面试重点)

思考:为什么块的大小不能设置太小,也不能设置太大?
1 HDFS 的块设置 太小 会增加寻址时间 ,程序一直在找块的开始位置;
2 )如果块设置的 太大 ,从 磁盘传输数据的时间 会明显 大于定位这个块开
始位置所需的时间 。导致程序在处理这块数据时,会非常慢。
总结: HDFS 块的大小设置主要取决于磁盘传输速率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值