Spark Streaming资源动态申请和动态控制消费速率原理剖析

最新推荐文章于 2022-04-25 14:36:39 发布

snail_gesture

最新推荐文章于 2022-04-25 14:36:39 发布

阅读量3.7k

点赞数 1

分类专栏： Spark Streaming源码详解文章标签： spark scala hadoop java 批处理

本文链接：https://blog.csdn.net/snail_gesture/article/details/51543197

版权

本文探讨了Spark Streaming在处理高峰值和低峰值时资源浪费的问题，以及动态调整资源的挑战，如Batch Duration的时间限制。文章介绍了如何开启Spark Streaming的动态资源申请，并讨论了通过spark.streaming.backpressure.enabled参数实现的动态控制消费速率的弹性机制。

摘要由CSDN通过智能技术生成

为什么需要动态？
a) Spark默认情况下粗粒度的，先分配好资源再计算。对于Spark Streaming而言有高峰值和低峰值，但是他们需要的资源是不一样的，如果按照高峰值的角度的话，就会有大量的资源浪费。
b) Spark Streaming不断的运行，对资源消耗和管理也是我们要考虑的因素。
Spark Streaming资源动态调整的时候会面临挑战：
Spark Streaming是按照Batch Duration运行的，Batch Duration需要很多资源，下一次Batch Duration就不需要那么多资源了，调整资源的时候还没调整完Batch Duration运行就已经过期了。这个时候调整时间间隔。

Spark Streaming资源动态申请
1. 在SparkContext中默认是不开启动态资源分配的，但是可以通过手动在SparkConf中配置。

// Optionally scale number of executors dynamically based on workload. Exposed for testing.
val dynamicAllocationEnabled = Utils.isDynami

最低0.47元/天解锁文章

snail_gesture

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Spark Streaming资源动态申请和动态控制消费速率原理剖析

为什么需要动态？ a) Spark默认情况下粗粒度的，先分配好资源再计算。对于Spark Streaming而言有高峰值和低峰值，但是他们需要的资源是不一样的，如果按照高峰值的角度的话，就会有大量的资源浪费。 b) Spark Streaming不断的运行，对资源消耗和管理也是我们要考虑的因素。 Spark Streaming资源动态调整的时候会面临挑战： Spark Streaming
复制链接

扫一扫

专栏目录