spark.reducer.maxReqsInFlight和spark.reducer.maxBlocksInFlightPerAddress

前言

本文隶属于专栏《Spark 配置参数详解》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见 Spark 配置参数详解

正文

属性名称默认值描述从哪个版本开始
spark.reducer.maxReqsInFlightInt.MaxValue此配置限制在任何给定点获取块的远程请求数。当集群中的主机数量增加时,可能会导致到一个或多个节点的大量入站连接,从而导致worker在负载下失败。通过允许它限制fetch请求的数量,可以缓解这种情况。2.0.0
spark.reducer.maxBlocksInFlightPerAddressInt.MaxValue此配置限制每个reduce任务从给定主机端口获取的远程块的数量。当在单个获取中或同时从给定地址请求大量块时,这可能会使服务 Executor 或 NodeManager 崩溃。当启用 External Shuffle 时,这对于减少 NodeManager 上的负载特别有用。可以通过将其设置为较低的值来缓解此问题。2.2.1

说明

这两个参数,本质上就是限制“文件下载服务”的吞吐

避免节点因为请求量过大而瘫痪掉,当并行度大到一定程度,N个reduce task去同一个节点拉数据,这有点类似 DOS 攻击

配置不当可能导致的问题

  1. buffer OOM
  2. http request time out
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值