HDFS(一、HDFS概述、客户端、shell操作)(更新中)

本文介绍了HDFS的基本概念,包括它的定义、优缺点、组成架构,重点解析了NameNode和DataNode的角色。此外,还详细阐述了HDFS文件块的大小,并列举了一系列常用的HDFS Shell操作,如ls、mkdir、put、get等。
摘要由CSDN通过智能技术生成

原文链接: HDFS(一、HDFS概述、客户端、shell操作).

1. HDFS定义

HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,他是分布式的,由很多服务器联合起来实现其功能,集群的中的服务器都有各自的角色。

HDFS使用场景:适合一次写入,多次读出的场景(不支持数据修改),且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用(读写频繁的)

2. HDFS优缺点

1. 优点:
在这里插入图片描述
2. 缺点:
在这里插入图片描述

3. HDFS组成架构

在这里插入图片描述

  1. **NameNode(nn):**就是master。它是一个主管,管理者。
    :管理HDFS的命名空间;
    :配置副本策略;
    :管理数据块(Block)的映射信息;
    :处理客户端读写请求。
  2. DataNode:就是Slave3.xworkerNameNode下达命令,DataNode 执行实际的操作。
    :存储实际的数据块;
    :执行数据块读写操作;
  3. Client:就是客户端。
    :文件切分,文件上传 HDFS 的时候,Client 将文件切分成一个个的 Block ,然后上传;
    :与
    NameNode
    交互,获取文件位置信息;
    :与DataNode交互,读取/写入数据;
    Client提供一些命令来管理HDFS,比如NameNode格式化;
    Client可以通过一些命令来访问HDFS,比如对HDFS的增删改查操作。
  4. Secondary NameNode:并非NameNode的热备,当NameNode挂掉时候,并不能马上替换NameNode并提供服务。
    :辅助NameNode,分担其工作量,比如定期合并Fsimage(镜像文件)Edits(编辑日志),并推送给NameNode
    :在紧急情况下,可辅助恢复NameNode

4. HDFS文件块大小

在这里插入图片描述
在这里插入图片描述
134217728/1024/1024 = 128M

如果磁盘为固态硬盘等传输速率更高的,则可以将block设置为更大的大小

**问:为什么**

5. HDFS的Shell操作

基本语法

[root@hadoop100 hadoop-3.2.1]# hdfs dfs
Usage: hadoop fs [generic options]
	[-appendToFile <localsrc> ... <dst>]
	[-cat [-ignoreCrc] <src> ...]
	[-checksum <src> ...]
	[-chgrp [-R] GROUP PATH...]
	[-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
	[-chown [-R] [OWNER][:[GROUP]] PATH...]
	[-copyFromLocal [-f] [-p] [-l] [-d] [-t <thread count>] <localsrc> ... <dst>]
	[-copyToLocal [-f] [-p] [-ignoreCrc] [-crc
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值