01-大象你好-Hadoop介绍

最新推荐文章于 2022-05-08 17:38:10 发布

isscollege

最新推荐文章于 2022-05-08 17:38:10 发布

阅读量481

点赞数

分类专栏：大象为什么会跳舞-Hadoop技术探秘文章标签： hadoop hadoop生态圈 hadoop发行版 yarn

本文链接：https://blog.csdn.net/isscollege/article/details/103250978

版权

Apache Hadoop是一个开源的、可扩展的、容错的数据处理框架，基于Java编写，适合处理大规模数据集。它包括HDFS、MapReduce和YARN三大核心组件，支持各种类型的数据，提供高容错性和高可用性。Hadoop的工作原理涉及数据分布式存储、MapReduce处理和资源管理。此外，Hadoop生态系统包含众多工具，如HBase、Hive、Pig等，进一步增强了大数据处理能力。

摘要由CSDN通过智能技术生成

Hadoop介绍

本章目标

Hadoop介绍
Hadoop技术架构
Hadoop9大特性

1 Hadoop介绍

Hadoop是什么

Apache Hadoop是用Java写的开源，可扩展、而且容错的数据处理框架

Hadoop可以在普通硬件集群上高效处理大量数据集
Hadoop不仅是一个存储系统，而且也是大数据的处理平台

Hadoop是来自ASF（Apache Software Foundation）的开源工具，Hadoop的源代码大部分来自Yahoo, IBM, Facebook, Cloudera。Hadoop为在多个集群节点上运行任务提供了高效的框架，它在多台机器上同时并行处理数据的能力。

Hadoop的思想源于google，google曾发表过两篇关于MapReduce编程模型和文件系统GSF的论文，这是这两篇论文成为Hadoop的思想源泉。Hadoop最初用于Nutch搜索引擎项目，该项目有Doug Cutting带头开发，因此Doug Cutting也被称为Hadoop之父。之后不久，由于Hadoop越来越受欢迎，就变成了顶级项目

Doug Cutting

在这里插入图片描述