MR和SPARK ON YARN 区别

最新推荐文章于 2022-02-07 09:52:51 发布

weixin_30716725

最新推荐文章于 2022-02-07 09:52:51 发布

阅读量195

点赞数

文章标签：大数据数据结构与算法

原文链接：http://www.cnblogs.com/xiangyuguan/p/11353169.html

版权

- 每个Task 运行完后，将释放所占用的资源，这些资源不能被其他Task 复用，即使是同一个作业相同类型的Task。也就是说，每个Task 都要经历“申请资源—> 运行Task –> 释放资源”的过程

- 每个节点上可以运行一个或多个Executor 服务
- 每个Executor 配有一定数量的slot，表示该Executor 中可以同时运行多少个ShuffleMapTask 或者ReduceTask
- 每个Executor 单独运行在一个JVM 进程中，每个Task 则是运行在Executor中的一个线程
- 同一个 Executor 内部的 Task 可共享内存，广播的文件或者数据结构只会在每个Executor 中加载一次，而不会像MapReduce 那样，每个Task 加载一次
- Executor 一旦启动后，将一直运行，且它的资源可以一直被Task 复用，直到Spark 程序运行完成后才释放退出

转载于:https://www.cnblogs.com/xiangyuguan/p/11353169.html