第二章 Hadoop生态系统与华为云服务MRS概述

1、开源Hadoop及其生态概述

1.1 Hadoop概述

概念:Hadoop被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力,几乎所有主流厂商都围绕Hadoop提供开发工具开源软件、商业化工具和技术服务,给大数据处理营造最佳的集成环境。

特点:1高可靠性 2高效性 3成本低 4高可扩展性 5高容错性 6丰富API

Hadoop核心组件构成:HDFS(解决海量数据存储问题) MapReduce(解决海量数据计算问题) YARN(解决资源调度和计算耦合的问题)

生态圈组件表

组件 功能
HDFS Hadoop的分布式文件系统
MapReduce 分布式计算框架
YARN 分布式资源管理和调度
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值