Spark之Stream高级知识分享四(kafkaStream终极调优)

宗旨:Spark Streaming 消费 Kafka一定要保证在批次时间内完成业务的处理,若出现处理延迟累加,最终可能会导致雪崩的现象。

1.kafkaStream消费者配置调优:

  • spark.streaming.kafka.maxRatePerPartition : 一个分区一秒拉取得消息数上限,这个生产必须配置,极度重要的一个参数,该参数在Direct API 才会有效
  • spark.streaming.backpressure.enabled:是否开启背压机制,根据上一批次的处理时长以及延迟时长,动态决定当前批次的拉取消息的速度。这个生产必须配置,因为即使开启了上限配置,但是设置是死的,数据存在低峰和高峰之分,还会存在一定资源的浪费,以及处理效率问题,注意:背压得到值一定是小于设置的上限数的。
  • spark.streaming.backpressure.initialRate:第一个批次初始的拉取消息数,个人觉得在开启拉取上限后该参数无需配置。
  • spark.streaming.stopGracefullyOnShutdown:是否开启优雅的关闭程序,当SparkContext关闭时,不直接关闭正正在出处理消息的程序,而是等待当前批次的消息处理完毕后才关闭。这个生产必须配置,不然大可能会出现丢数据或者重复消费的问题

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值