大数据&&Yarn&&入门教程

概述

Yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序

特点

待补充:服务的突出特点

适用场景:

001

002

相关概念

YARN 调度器

Hadoop 作业调度器主要有三种:FIFO、容量、公平调度器。Hadoop 3.1.3 默认的资源调度器是容量调度器。
FIFO调度器

  • 单队列,根据提交作业的先后顺序,先来先服务

容量调度器

  • 是Yahoo开发的多用户调度器
  • 多队列:每个队列可配置一定的资源量
  • 容量保证:管理员可为每个队列设置资源最低保证和资源使用上限
  • 灵活性:如果一个队列中的资源有剩余,可以暂时共享给那些需要资源的队列,而一旦该队列有新的应用和程序提交,则其他队列借调的资源会归还给该队列
  • 多租户:支持多用户共享集群和多应用程序同时运行。为了防止同一个用户的作业独占队列中的资源,该调度器会对同一用户提交的作业所占资源量进行限定
  • 分配算法
    • 队列资源分配:从root 开始,使用深度优先算法,优先选择资源占用率最低的队列分配资源
    • 作业资源分配:默认按照提交作业的优先级和提交时间顺序分配资源
    • 容器资源分配:按照容器的优先级分配资源,如果优先级相同,按照数据本地性原则

公平调度器

  • 是 Facebook 开发的多用户调度器
  • 具有与容量调度器的相同特点
  • 不同点为
    • 缺额:某一个时刻一个作业应获得资源和实际获取资源的差距叫“缺额”
    • 核心调度策略不同(容量调度器优先选择资源利用率低的队列;公平调度器优先选择对资源的缺额比例大的队列)
    • 每个队列可以单独设置资源分配方式(容量调度器:FIFO、DRF;公平调度器:FIFO、FAIR、DRF)

优缺比较

待补充:(自比较、同步类比较)

应用架构

在这里插入图片描述

  • ResourceManager(RM):整个集群资源(内存、CPU等)的管理者
  • NodeManager(NM):单个节点服务器的管理者
  • ApplicationMaster(AM):单个任务运行的负责人
  • Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源(内存、CPU、磁盘、网络)
  • 注意
    • 客户端可以有多个
    • 集群上可以运行多个 ApplicationMaster
    • 每个 NodeManager 上可以有多个 Container

工作原理、流程

在这里插入图片描述

部署应用

环境信息

安装xxx

待补充:基础的安装、配置/性能、启动

搭建集群

通用集群A

集群架构

环境信息

安装xxx

待补充:可用性、扩展性、性能、负载均衡

备份恢复

待补充:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值