Hadoop功能与使用详解(HDFS+YARN)

本文深入探讨了Hadoop的核心组件,包括HDFS的架构解析、NameNode与DataNode、Block缓存、HDFS联邦和机架感知。同时,详细介绍了YARN的架构演变、基本流程、进程组件如ResourceManager、NodeManager和ApplicationMaster。此外,还涵盖了MapReduce的Map和Reduce阶段以及配置文件的常用参数。最后,讨论了Hadoop集群的安装、常见操作和错误处理,如NN异常恢复、安全模式、数据平衡、集群扩缩容和快照管理。
摘要由CSDN通过智能技术生成

1 服务概述

Hadoop是一个开源的分布式计算和存储框架,由Apache基金会开发和维护。Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。

Hadoop使用Java开发,所以可以在多种不同硬件平台的计算机上部署和使用。其核心部件包括分布式文件系统 (Hadoop DFS,HDFS) 和MapReduce。

1.1 HDFS

Hadoop Distributed File System,Hadoop分布式文件系统,简称HDFS

在这里插入图片描述

1.1.1 架构解析

1.1.1.1 Block 数据块
  • 基本存储单元,1.x版本默认64M,2.x版本之后默认128M;
  • 单个文件会被拆分成为一个个大小相同的块数据,存储在不同的机器上,当一个文件小于Block设置的大小,那么实际占用的空间为其文件的大小;
  • 基本
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Studying!!!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值