HADOOP--HDFS简介

最新推荐文章于 2024-08-29 16:07:21 发布

lfsf802

最新推荐文章于 2024-08-29 16:07:21 发布

阅读量1.3w

点赞数

分类专栏： J2EE 框架/工具大数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lfsf802/article/details/8978260

版权

HDFS是Hadoop的分布式文件系统，具备高容错性和高吞吐量的数据访问特性，适用于大规模数据集。其设计理念针对大文件存储，采用流式数据访问模式，每个block默认为64MB并在多台datanode上保存副本。Namenode存储元数据，而datanode负责数据存储和容错。HDFS通过多副本、数据分布和故障恢复机制确保高可用性和快速访问。

摘要由CSDN通过智能技术生成

HDFS是什么？

HADOOP DISTRIBUTED FILE SYSTEM，简称HDFS，是一个分布式文件系统。它是谷歌的GFS提出之后出现的另外一种文件系统。它有一定高度的容错性，而且提供了高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案。

在最初，HADOOP是作为Apache Nutch搜索引擎项目的基础架构而开发的，后来由于它独有的特性，让它成为HADOOP CORE项目的一部分。

HDFS的设计思路？

是什么提供它高吞吐量的数据访问和适合大规模数据集的应用的特性呢，这就要说一下它的设计思路。

首先HDFS的设计之初就是针对超大文件的存储的，小文件不会提高访问和存储速度，反而会降低；其次它采用了最高效的访问模式，也就是经常所说的流式数据访问，特点就是一次写入多次读取；再有就是它运行在普通的硬件之上的，即使硬件故障，也就通过容错来保证数据的高可用。

HDFS的一些概念：

Block：大文件的存储会被分割为多个block进行存储。默认为64MB，每一个blok会在多个datanode上存储多份副本，默认为3份。[这些设置都能够通过配置文件进行更改]

Namenode：主要负责存储一些metadata信息，主要包括文件目录、block和文件对应关系，以及block和datanote的对应关系

Datanode：负责存储数据，上面我们所说的高度的容错性大部分在datanode上实现的[还有一部分容错性是体现在namenode和secondname，

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lfsf802 CSDN认证博客专家 CSDN认证企业博客

码龄14年

189: 原创

4万+: 周排名

44万+: 总排名

155万+: 访问

: 等级

1万+: 积分

1576: 粉丝

961: 获赞

1943: 评论

348: 收藏

私信

关注

热门文章

分类专栏

最新评论

CentOS下彻底删除SELinux的方法
weixin_53685918: 你自己看看这叫干掉嘛???!!!
web打印实现几种方法
程序员生活圈: 推荐老牌打印控件WebPrinter。新版更名为“智睦云打印”后在原来的基础上增加了云打印机的支持，作为Web打印控件，支持支持跨网、跨系统的打印，支持完整的打印参数，支持HTML、PDF、Office等多种格式，稳定、快速、不崩溃。同时支持Javascript API和Open API两种接入方式。参考网址：https://any.webprinter.cn/
ZMQ简介
BryceandWendy: 大人，zmq已经可以用在liunx上了
web打印实现几种方法
dong0738: 有关网页打印的这几篇文章还是比较专业的 https://www.cnblogs.com/dong0738/p/10990842.html
Java调用ZMQ
Em_dark 回复源者鬼道: 不订阅的话,客户端是收不到任何消息的, 只有订阅了,才能收到消息, 根据消息帧来划分的.

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。