大数据之hadoop中的HDFS（包括客户端操作）

最新推荐文章于 2023-02-12 07:15:00 发布

独创之上

最新推荐文章于 2023-02-12 07:15:00 发布

阅读量1.8k

点赞数

分类专栏：大数据文章标签： hadoop big data hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a18379692263/article/details/121269658

版权

1、概述

随着数据量的日益增长，数据的存储问题尤为突出，HDFS就是分布式文件管理系统中的一种。主要适用于一次写入，多次读出的场景。

hdfs优点：高容错性（数据自动保存多个副本，通过增加副本的形式，提高容错性；某个副本丢失以后，可以自动恢复。）；适合处理大数据；可构建在廉价机器上。

hdfs缺点：不适合低延时数据访问；无法高效的对大量小文件进行存储；不支持并发写入、文件随机修改（一个文件只能有一个写，不允许多个线程同时写；仅支持数据append，不支持文件的随机修改）。

HDFS组成架构

其中：NameNode（nn）：就是文件的管理者，管理HDFS的名称空间；配置副本策略；管理数据块映射信息；处理客户端读写请求。DataNode：就是执行NameNode下达的命令，主要存储实际的数据块，执行数据块的读/写操作。Client：客户端，负责文件的切分（文件上传时，Client将文件切分成一个一个的块，然后上传），与NameNode进行交互，获取文件的位置信息，与DataNode交互，读取或者写入数据；提供一些命令来管理HDFS，同时访问HDFS进行增删改查操作。Seconddary NameNode：辅助NameNode，分担其工作量，比如定期合并Fsimage和Edits，并推送给NameNode ；在紧急情况下，可辅助恢复NameNode。

2、HDFS的shell操作

基本语法：hadoop fs 具体命令

常用命令：

上传：-moveFromLocal：从本地剪切粘贴到HDFS；

-copyFromLocal：从本地文件系统中拷贝文件到 HDFS 路径去（本地文件依然存在）

-put：等同于 copyFromLocal，生产环境更习惯用 put

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
大数据之hadoop中的HDFS（包括客户端操作）

1、概述随着数据量的日益增长，数据的存储问题尤为突出，HDFS就是分布式文件管理系统中的一种。主要适用于一次写入，多次读出的场景。 hdfs优点：高容错性（数据自动保存多个副本，通过增加副本的形式，提高容错性；某个副本丢失以后，可以自动恢复。）；适合处理大数据；可构建在廉价机器上。 hdfs缺点：不适合低延时数据访问；无法高效的对大量小文件进行存储；不支持并发写入、文件随机修改（一个文件只能有一个写，不允许多个线程同时写；仅支持数据append，不支持...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

独创之上 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。