(1)hadoop调度器分为三类:
FIFO、Capacity Scheduler(容量调度器)和Fair Sceduler(公平调度器)
Apache默认的资源调度器是容量调度器;
CDH默认的资源调度器是公平调度器;
(2)区别
FIFO调度器:支持单队列,先进先出,生产环境不会用;
容量调度器:支持多队列,保证先进入的任务有限执行;
公平调度器:支持多队列,保证每个任务公平享有队列资源,资源不够时可以按照缺额分配。
(3)在生产环境下如何选择?
大厂:如果对并发度要求比较高,选择公平,要求服务器性能必须OK;
中小公司,集群服务器资源不太充裕选择容量。
(4)在生产环境怎么创建队列?
调度器默认就1个default队列,不能满足生产要求;
按照框架:hive/spark/flink每个框架的任务方队指定的队列(企业用的不是特别多)
按照业务模块:登录注册、购物车、下单、业务部门1、业务部门2
创建多队列的好处?
(1)因为担心员工不小心,写递归死循环代码,把所有资源全部耗尽。
(2)实现任务的降级使用,特殊时期保证重要的任务队列资源充足。
业务部门1(重要)=》业务部门2(比较重要)=》下单(一般)=》购物车(一般)=》登录注册(次要)
Yarn调度器及生产环境如何使用多队列
最新推荐文章于 2022-05-02 16:54:51 发布