面试问到这个参数 真没用过。。。
从网上找了下
https://blog.csdn.net/onway_goahead/article/details/95041760
spark.streaming.kafka.maxRatePerPartition这个参数是控制吞吐量的,一般和spark.streaming.backpressure.enabled=true一起使用。那么应该怎么算这个值呢。
如例要10分钟的吞吐量控制在5000,0000,kafka分区是10个。
spark.streaming.kafka.maxRatePerPartition=8400这个值是怎么算的呢。如下是公式
spark.streaming.kafka.maxRatePerPartition的值 * kafka分区数 * (10 *60)(每秒时间)
-
本文探讨了Spark Streaming中如何通过调整spark.streaming.kafka.maxRatePerPartition参数来控制数据吞吐量,特别是在与backpressure机制结合使用时的效果。举例说明了如何根据所需吞吐量和Kafka分区数量计算该参数的合理值。
6008

被折叠的 条评论
为什么被折叠?



