测试学习大数据之Hadoop——概念入手

最新推荐文章于 2024-09-16 11:16:36 发布

adanjeep

最新推荐文章于 2024-09-16 11:16:36 发布

阅读量201

点赞数

分类专栏：大数据相关文章标签：大数据 Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/adanjeep/article/details/93624495

版权

大数据相关专栏收录该内容

1 篇文章 0 订阅

订阅专栏

概念入手认识Hadoop

Hadoop是一个开源的，能够对大量数据进行分布式处理的软件框架，它具有可靠性、高效性及可伸缩性。

ApacheHadoop软件库是一个框架，它允许使用简单的编程模型在计算机集群之间对大型数据集进行分布式处理。它被设计成从单个服务器扩展到数千台机器，每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性，而是设计用于检测和处理应用程序层的故障，因此在计算机集群的顶部提供高可用性服务，每台计算机都可能发生故障。

可以理解为Hadoop是一个框架系统项目，它由很多子模块组成，其中核心模块有：HDFS、Yarn、MapReduce。

HDFS（Hadoop Distributed File System）是位于Hadoop底层的分布式文件系统，用于存储 Hadoop 集群中所有存储节点上的文件；

Yarn（Yet Another Resource Negotiator）是一个作业调度和集群资源管理框架；

MapReduce是基于Yarn的大型数据集并行处理系统；

下图显示了 Hadoop 生态系统的各种组件

可参考相关链接理解学习：

官网：http://hadoop.apache.org/

百度百科：https://baike.baidu.com/item/Hadoop

大神文章：https://www.cnblogs.com/heavenwang/p/3988033.html

参考文档：http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_design.html

根据官网，Hadoop相关的项目有：

Zeppelin

Xxl_job

Azkaban

Sqoop

Flink

Prometheus

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。