Hadoop Distributed File System

最新推荐文章于 2024-05-17 19:36:24 发布

zj_johnny

最新推荐文章于 2024-05-17 19:36:24 发布

阅读量106

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_johnny/article/details/89875764

版权

Hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HDFS 概述

分布式
commodity hardware
fault-tolerant 容错
high throughput 高吞吐
large data sets

HDFS前提和设计目标

Hardware Failure 硬件错误

每个机器只存储文件的部分数据，blocksize=128M，block存放在不同服务器，默认3副本机制

Streaming Data Access 流式数据访问

The emphasis is on high throughput of data access rather than low latency of data access.

Large Data Sets

数据大不怕，怕数据小

Moving Computation is Cheaper than Moving Data 移动计算比移动数据更划算

HDFS架构 *****

NameNode（master） and DataNodes
master/slave的架构
NN: the file system namspace ; regulates access to files by clients
DN: storage
HDFS exposes a file system namespace and allows user data to be stored in files
a file is split into one or more blocks
blocks are stored in a set of DataNodes （容错）
NameNode executes file system namespace operations: CRUD
NameNode determines the mapping of blocks to DataNodes (决定文件block的映射,用户不感知）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。