大数据技术之Hadoop（HDFS）第1章 HDFS概述

最新推荐文章于 2023-07-22 10:36:53 发布

尚硅谷铁杆粉丝

最新推荐文章于 2023-07-22 10:36:53 发布

阅读量604

点赞数

分类专栏： Java 文章标签： Java Linux IT 大数据尚硅谷

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sggtgfs/article/details/81626608

版权

本文介绍了HDFS产生的背景，阐述了HDFS的概念，强调其在大数据处理中的优势，如高容错性和适合流式数据访问，同时也指出其不足，如不支持低延时访问和小文件存储。此外，详细解析了HDFS的组成架构，包括Client、NameNode、DataNode和Secondary NameNode的角色，并提到了文件块大小的设定和意义。

摘要由CSDN通过智能技术生成

1.1 HDFS产生背景

随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。

1.2 HDFS概念

HDFS，它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。

HDFS的设计适合一次写入，多次读出的场景，且不支持文件的修改。适合用来做数据分析，并不适合用来做网盘应用。

1.3 HDFS优缺点

1.3.1 优点

1）高容错性

（1）数据自动保存多个副本。它通过增加副本的形式，提高容错性；

（2）某一个副本丢失以后，它可以自动恢复。

2）适合大数据处理

（1）数据规模：能够处理数据规模达到GB、TB、甚至PB级别

最低0.47元/天解锁文章

尚硅谷铁杆粉丝

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
大数据技术之Hadoop（HDFS）第1章 HDFS概述

1.1 HDFS产生背景随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。1.2 HDFS概念HDFS，它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群...
复制链接

扫一扫

专栏目录

尚硅谷铁杆粉丝 CSDN认证博客专家 CSDN认证企业博客

码龄6年

0: 原创

29万+: 周排名

210万+: 总排名

16万+: 访问

: 等级

6339: 积分

239: 粉丝

82: 获赞

23: 评论

309: 收藏

私信

关注

热门文章

分类专栏

Java 525篇
H5+前端
Python
Linux 63篇
大数据 63篇
尚硅谷 63篇
IT 63篇

最新评论

大数据技术之Hadoop（HDFS）第8章 HDFS HA高可用
菜菜的大数据开发之路: 一个好的程序员是那种过单行线马路都要往两边看的人。(Doug Linder)
XML命名空间详解
学无常: 好感动😭😭😭终于明白xmlns是什么了
Java 之23种设计模式解析
路飞: 王路飞来给你点个赞！欢迎回访
大数据技术之Hadoop（HDFS）第8章 HDFS HA高可用
Tisfy: 他能使人有三月不知肉味，使人有余音穿梁，三日不绝的感受
官宣：教父级讲师李明加入尚硅谷
qq_25932837: 根据你的经验，若你足够努力，五年可以成为领域内的专家 2001年大学毕业，近20年了看看你的《细说linux》的销量内容吴翰清的《白帽子讲Web安全》，说他是2000年的时候进入西安交大学习，05年远程关闭了阿里路由设备，07年成为了阿里的最年轻的技术专家。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。