Hadoop学习总结（一）之Hadoop基础知识

最新推荐文章于 2024-05-01 17:24:41 发布

風の住む街~

最新推荐文章于 2024-05-01 17:24:41 发布

阅读量566

点赞数

分类专栏： # Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38924500/article/details/106785142

版权

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hadoop基础知识

1.Hadoop是什么

Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据谷歌公司发表的MapReduce和Google文件系统的论文自行实现而成。所有的Hadoop模块都有一个基本假设，即硬件故障是常见情况，应该由框架自动处理。广义上讲Hadoop更像是一个Hadoop生态圈。
在这里插入图片描述

2.Hadoop的发展

可以参靠Google在大数据方面的三篇论文，能够清楚了解其是怎样发展为现在版本。
GFS发展为HDFS,Map-Reduce发展为MapReduce,BigTable发展为HBase.
在这里插入图片描述

3.Hadoop组成

在这里插入图片描述

3.1 HDFS架构

HDFS（Hadoop Distributed File System）

NameNode(nn):存储文件的元数据
DataNode(dn):在本地文件系统存储文件块数据，以及块数据的校验
Secondary NameNode(2nn):用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照。

3.2YARN架构

在这里插入图片描述

3.3MapReduce架构

MapReduce将计算过程分为两个阶段：Map和Reduce
1）Map阶段并行处理输入数据
2）Reduce阶段对Map结果进行汇总

3.4生态系统组成

在这里插入图片描述

下一篇：Hadoop学习总结（二）之Centos7安装Hadoop-2.9.2及相应配置

風の住む街~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。