MR和SPARK ON YARN 区别

  • MapReduce 多进程模型MapReduce 应用程序是让每个Task 动态申请资源,且运行完后马上释放资源

 

    • 每个Task 运行在一个独立的JVM 进程中
    • 可单独为不同类型的Task 设置不同的资源量,目前支持内存和CPU 两种资源
    • 每个Task 运行完后,将释放所占用的资源,这些资源不能被其他Task 复用,即使是同一个作业相同类型的Task。也就是说,每个Task 都要经历“申请资源—> 运行Task –> 释放资源”的过程

 

  • Spark 多线程模型第一步是构建一个可重用的资源池,然后在这个资源池里运行所有的ShuffleMapTask 和ReduceTask

    • 每个节点上可以运行一个或多个Executor 服务

    • 每个Executor 配有一定数量的slot,表示该Executor 中可以同时运行多少个ShuffleMapTask 或者ReduceTask

    • 每个Executor 单独运行在一个JVM 进程中,每个Task 则是运行在Executor中的一个线程

    • 同一个 Executor 内部的 Task 可共享内存, 广播的文件或者数据结构只会在每个Executor 中加载一次,而不会像MapReduce 那样,每个Task 加载一次

    • Executor 一旦启动后,将一直运行,且它的资源可以一直被Task 复用, 直到Spark 程序运行完成后才释放退出

转载于:https://www.cnblogs.com/xiangyuguan/p/11353169.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值