04-Hadoop为什么会跳舞-Hadoop是如何工作的

本文详细介绍了Hadoop的架构和工作过程,包括HDFS的NameNode和DataNode,MapReduce的处理流程,以及Yarn的资源管理和调度。Hadoop通过分布式存储和处理大数据,提供高可靠性和高容错性。
摘要由CSDN通过智能技术生成

Hadoop内部是如何工作的-深入Hadoop

本章目标

  1. Hadoop架构
  2. Hadoop工作原理

Hadoop架构

Apache Hadoop是一个开源软件框架,它以分布式的方式存储数据,并以并行的方式处理数据。Hadoop提供了世界上最可靠的存储层-HDFS,一个批处理引擎-MapReduce以及一个资源管理层-YARN。
在本节,我们将深入Hadoop,了解Hadoop内部是如何工作的。

在这里插入图片描述

什么是Hadoop?

在我们学习Hadoop如何工作之前,我们有必要了解Hadoop基本概念,我们需要知道Hadoop到底是什么。Apache Hadoop是一套开源软件工具。它利用网络中的众多计算机来解决海量数据的处理问题。它提供了一套软件框架用于分布式存储以及分布式计算。它将文件分割成众多数据块,并将它们存储到计算机集群中。Hadoop通过在集群上复制数据块以实现容错。它通过将作业分割成彼此独立的任务来实现分布式处理。这些任务会在计算机集群上并行执行。

Hadoop组件

我们如果不了解Hadoop的核心组件就无法了解Hadoop是如何运行的。Hadoop由3个层(核心组件)构成,它们是:

HDFS-Hadoop分布式文件系统(Hadoop Distributed File System)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值