【学习】Hadoop大数据平台架构与实践--基础篇中

黄黄臭臭

于 2017-03-19 21:11:05 发布

阅读量1.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：学习总结系统架构文章标签：大数据 hadoop 架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huanglong8/article/details/63695488

本文介绍了Hadoop的核心组件HDFS和MapReduce。HDFS采用固定大小的64MB数据块存储文件，并通过NameNode和DataNode实现数据的管理和存储，提供容错机制。MapReduce通过分而治之的策略处理大规模数据，JobTracker负责任务调度，TaskTracker执行任务。HDFS支持批量读写，适用于大数据处理，但不适用于低延迟交互式应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章来源：
http://blog.csdn.net/huanglong8/article/details/63695488

视频教学来源：
http://www.imooc.com/learn/391

3. Hadoop的核心-HDFS简介

HDFS的文件都被分块存储，并且是固定比例的。默认大小是64MB。块是作为处理的逻辑单元。

有两个节点概念：
1. NameNode是管理节点，存放文件元数据
主要包括文件和数据块的映射表，数据块与数据节点的映射表。
2. DataNode是工作节点，存放的是真正的数据块。
这里写图片描述

基本可以理解为，当有一个大小为 1GB的文件进行存储时，HD会将其划分为 64MB * 16 。也就是会将这个文件拆成 16个块，将每块分别存储到指定位置，通过映射表来进行管理。

快速存放，副本三份。容错处理。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。