Hadoop大数据系列之一---Hadoop架构原理分析

最新推荐文章于 2024-07-24 20:24:15 发布

hehuanlin123

最新推荐文章于 2024-07-24 20:24:15 发布

阅读量657

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hehuanlin123/article/details/56038837

版权

大数据专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1.单节点体系

2.集群结构分析

3.HDFS架构分析

Hadoop分布式文件系统；

按需定制MapReduce；》大数据量（纯文本）

目标在于多次的文件流读取；》优势在于一次写入，多次读取

写入成本很高；

高度数据冗余（副本，默认3）；

每个节点不需要RAID-独立磁盘冗余阵列：redundant array of independent disks；

Blocksize较大（128m）；

定制节点的位置感知；

4.NN和DN原生文档解读

NameNode

1.存储文件元数据，比如目录结构

2.运行NameNode的服务器至关重要，只有1个

3.只对元数据的增删做日志记录，不对block和文件流做记录

4.DataNode故障时，负责创建更多的副本block

HDFS架构

============================================================================================================

DataNode

1.存储真实数据

2.可运行在多种文件系统上（ext3/4，NTFS...）

3.通知NameNode自己有哪些block

4.NameNode在同一机架创建放置一个副本，另一机架放置2个副本

5.启动脚本分析

HDFS部分

yarn部分

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。