【hadoop期末复习】第三章 分布式文件系统HDFS 超详细讲解(更新完毕)

本文详细讲解了Hadoop的分布式文件系统HDFS,包括其命名空间(目录、文件和块),通信协议(基于TCP/IP的RPC)和多副本冗余存储的优势(加快传输速度、检查数据错误、确保数据可靠性)。同时,介绍了NameNode与DataNode的角色和功能,以及HDFS如何通过心跳机制实现高水平拓展。此外,还讨论了HDFS的局限性,如不支持低延迟数据访问和多用户写入。最后,概述了HDFS在数据错误检测和恢复的方法,以及读写文件的流程。
摘要由CSDN通过智能技术生成

** 本专栏的Hadoop复习计划文章内容主要包含以下几个部分:

【简单】学习通习题

【进阶】课本课后练习

【操作】相关章节实验回顾

** 使用教材:大数据技术原理与应用(第3版)林子雨 编著

** 教材课后答案点这里

让我们开始吧!

学习通 - 习题

1. HDFS的命名空间不包含

A.目录
B.块
C.文件
D.字节

我的答案:D

解析:

【什么是命名空间】

1)HDFS 集群

  • 1 个 名称节点(NameNode
  • 若干个数据节点(DataNode

2)名称节点(NameNode

  • 中心服务器
  • 职责:管理文件系统的命名空间、客户端对文件的访问

3)命名空间包含:

  • 目录
  • 文件

【什么是块】

块是HDFS中的储存单位,一个块大小为64MB,一个文件可以被分割成多个块,便于储存


2. 对HDFS通信协议的理解错误的是

A.客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的
B.HDFS通信协议都是构建在IoT协议基础之上的
C.名称节点和数据节点之间则使用数据节点协议进行交互
D.客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互
我的答案:B

解析:

【什么是通信协议】

通信协议是计算机与网络之间进行信息传输时,所必须要遵守的一系列人为设定的规则

【TCP/IP 协议】

TCP/IP协议,也叫作网络通讯协议。它是在网络的使用中的最基本的通信协议

TCP/IP传输协议对互联网中各部分进行通信的标准和方法进行了规定

【HDFS为什么需要通信协议】

HDFS需要通过网络进行集群之间的数据传输,故需要制定相应的通信协议

B.【所有的HDFS通信协议都是构建在TCP/IP协议基础之上】

D.【客户端通过一个可配置的端口向NameNode主动发起TCP连接,并使用客户端协议与NameNode进行交互】

【什么是TCP链接】

TCP 是用于应用程序之间的通信链接

A.【客户端DataNode之间的通过RPC来实现】

NameNode不会主动发起RPC,而是响应来自客户端和DataNode的RPC请求

C.【NameNodeDataNode之间通过DataNod

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值