hdfs学习---hdfs架构

最新推荐文章于 2022-09-28 19:23:10 发布

Hello_W0rld

最新推荐文章于 2022-09-28 19:23:10 发布

阅读量4.7k

点赞数 1

分类专栏：基础技术文章标签： hadoop 云计算 hdfs 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xman_2009/article/details/9391745

版权

本文详细介绍了HDFS（Hadoop Distributed File System）的特点和架构，包括其错误处理机制、文件访问模型、数据节点与名称节点的角色以及读写数据的流程。HDFS以大数据处理为目标，支持write-once-read-many模式，并采用了rack-aware策略优化副本分布，提高可靠性与性能。

摘要由CSDN通过智能技术生成

hdfs是hadoop开源项目的一部分，实际上是google分布式文件系统GFS的开源实现。

一、hdfs的主要特点

1、硬件错误是常态，而非异常情况， HDFS 可能是有成百上千的 server 组成，任何一个组件都有可能一直失效，因此错误检测和快速、自动的恢复是 HDFS 的核心架构目标。

2、跑在 HDFS 上的应用与一般的应用不同，它们主要是以流式读为主，做批量处理；比之关注数据访问的低延迟问题，更关键的在于数据访问的高吞吐量。

3、 HDFS 以支持大数据集合为目标，一个存储在上面的典型文件大小一般都在千兆至 T 字节，一个单一 HDFS 实例应该能支撑数以千万计的文件。

4、 HDFS 应用对文件要求的是 write-one-read-many 访问模型。一个文件经过创建、写，关闭之后就不需要改变。这一假设简化了数据一致性问题，使高吞吐量的数据访问成为可能。典型的如 MapReduce 框架，或者一个 web crawler 应用都很适合这个模型。

5、移动计算的代价比之移动数据的代价低。一个应用请求的计算，离它操作的数据越近就越高效，这在数据达到海量级别的时候更是如此。将计算移动到数据附近，比之将数据移动到应用所在显然更好， HDFS 提供给应用这样的接口。

二、hdfs的架构组织

整体架构图如下：

一个 HDFS 集群是有一个 Namenode 和一定数目的 Datanode 组成。 Namenode 是一个中心服务器，负责管理文件系统的 namespace

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。