【Flink 源码解析】Buffer Timeout优化

Buffer Timeout 概念

Flink中每个算子向下游发送数据需要满足两个条件:

  • 输出缓冲区(output buffer)已满。
  • 缓冲区中的数据存在时间超过了缓冲区超时配置值(默认为100毫秒)。

这个配置值对于Flink的性能影响非常关键。配置得较低时,数据的延迟会很小,但可能导致大量高频率的网络通信,同时显著增加CPU占用率。配置值设置得较高时,缓冲区会更频繁地被填满,从而导致数据的延迟增加。有研究表明,在高并发的情况下,如果对数据的延迟要求不是极其敏感,适度增加缓冲区超时值(例如设置为1秒左右)可以降低CPU使用率,幅度在30%到50%之间。

这样的调整可以在一定程度上平衡数据延迟和系统资源的使用,特别是在大规模并发场景下,更合理地配置缓冲区超时值可能对系统性能产生积极的影响。

Buffer Timeout 配置

Buffer timeout在Flink中有两个级别:全局级别和算子级别。
全局级别的Buffer timeout可以通过StreamExecutionEnvironment.setBufferTimeout方法进行配置。以下是一个示例代码:

public StreamExecutionEnvironment setBufferTimeout(long timeoutMillis) {
    if (timeoutMillis < -1) {
        throw new IllegalArgumentException("Timeout of buffer must be non-negative or -1");
    }

    this.bufferTimeout = timeoutMillis;
    return this;
}

在构造StreamGraph时,StreamExecutionEnvironment中设置的bufferTimeout会被作为默认的缓冲超时时间使用。如果用户没有为算子指定专门的缓冲超时时间,系统将自动采用默认的缓冲超时时间。

值得注意的是,算子级别的缓冲超时时间仅影响相应算子的配置,而这个级别对应的是SingleOutputStreamOperator。
我们查看它的setBufferTimeout方法:

public SingleOutputStreamOperator<T> setBufferTimeout(long timeoutMillis) {
    checkArgument(timeoutMillis >= -1, "timeout must be >= -1");
    transformation.setBufferTimeout(timeoutMillis);
    return this;
}

它为算子对应的Transformation对象设置了bufferTimeout属性。

Buffer Timeout 如何影响StreamGraph

Flink把Transformation翻译为StreamGraph需要用到各种各样的translator。我们查看下它的基类SimpleTransformationTranslator的configure方法片段;

// ...
StreamGraphUtils.configureBufferTimeout(
    streamGraph, transformationId, transformation, context.getDefaultBufferTimeout());
// ...

它使用了StreamGraphUtils配置StreamGraph的缓存timeout。详细内容我们需要展开分析configureBufferTimeout方法:

public static <T> void configureBufferTimeout(
    StreamGraph streamGraph,
    int nodeId,
    Transformation<T> transformation,
    long defaultBufferTimeout) {

    if (transformation.getBufferTimeout() >= 0) {
        streamGraph.setBufferTimeout(nodeId, transformation.getBufferTimeout());
    } else {
        streamGraph.setBufferTimeout(nodeId, defaultBufferTimeout);
    }
}

它接收的4个参数分别为:需要生成的streamGraph,StreamNode id,Transformation和默认的buffer timeout配置(StreamExecutionEnvironment级别的配置为默认配置)。

该方法又调用了StreamGraph的setBufferTimeout方法。我们继续跟踪。这个方法为Transformation对应的StreamNode设置bufferTimeout属性。

public void setBufferTimeout(Integer vertexID, long bufferTimeout) {
    if (getStreamNode(vertexID) != null) {
        getStreamNode(vertexID).setBufferTimeout(bufferTimeout);
    }
}

到此位置我们得知用户为每个算子设定的buffer timeout配置最终反应到了StreamGraph中算子对应StreamNode的bufferTimeout属性。

Buffer Timeout 如何影响数据处理行为

我们查看StreamEdge的构造函数:

public StreamEdge(
    StreamNode sourceVertex,
    StreamNode targetVertex,
    int typeNumber,
    StreamPartitioner<?> outputPartitioner,
    OutputTag outputTag,
    StreamExchangeMode exchangeMode) {

    this(
        sourceVertex,
        targetVertex,
        typeNumber,
        sourceVertex.getBufferTimeout(),
        outputPartitioner,
        outputTag,
        exchangeMode);
}

可以发现StreamEdge的bufferTimeout是由sourceVertex,即Edge上游StreamNode的bufferTimeout属性决定的。

接着追踪StreamEdge的bufferTimeout调用过程,我们找到了StreamTask.createRecordWriter方法调用:

private static <OUT>
    List<RecordWriter<SerializationDelegate<StreamRecord<OUT>>>> createRecordWriters(
    StreamConfig configuration, Environment environment) {
    List<RecordWriter<SerializationDelegate<StreamRecord<OUT>>>> recordWriters =
        new ArrayList<>();
    List<StreamEdge> outEdgesInOrder =
        configuration.getOutEdgesInOrder(
        environment.getUserCodeClassLoader().asClassLoader());

    // 遍历每个StreamEdge,逐个创建RecordWriter
    // RecordWriter的bufferTimeout为Edge的bufferTimeout
    for (int i = 0; i < outEdgesInOrder.size(); i++) {
        StreamEdge edge = outEdgesInOrder.get(i);
        recordWriters.add(
            createRecordWriter(
                edge,
                i,
                environment,
                environment.getTaskInfo().getTaskNameWithSubtasks(),
                edge.getBufferTimeout()));
    }
    return recordWriters;
}

createRecordWriter方法内容片段如下。可知RecordWriter通过RecordWriterBuilder创建:

RecordWriter<SerializationDelegate<StreamRecord<OUT>>> output =
        new RecordWriterBuilder<SerializationDelegate<StreamRecord<OUT>>>()
                .setChannelSelector(outputPartitioner)
                .setTimeout(bufferTimeout)
                .setTaskName(taskName)
                .build(bufferWriter);

继续查看RecordWriterBuilder的build方法:

public RecordWriter<T> build(ResultPartitionWriter writer) {
    if (selector.isBroadcast()) {
        return new BroadcastRecordWriter<>(writer, timeout, taskName);
    } else {
        return new ChannelSelectorRecordWriter<>(writer, selector, timeout, taskName);
    }
}

无论创建的是BroadcastRecordWriter(广播形式写入数据到输出缓存)还是ChannelSelectorRecordWriter(把数据写入到特定channel,例如keyBy算子),他们的父类都为RecordWriter。所以接下来需要展开分析的内容为RecordWriter。

我们查看RecordWriter的构造函数,发现其中创建了一个OutputFlush对象(如果没有禁用network buffer timeout的话):

RecordWriter(ResultPartitionWriter writer, long timeout, String taskName) {
    this.targetPartition = writer;
    this.numberOfChannels = writer.getNumberOfSubpartitions();

    this.serializer = new DataOutputSerializer(128);

    checkArgument(timeout >= ExecutionOptions.DISABLED_NETWORK_BUFFER_TIMEOUT);
    this.flushAlways = (timeout == ExecutionOptions.FLUSH_AFTER_EVERY_RECORD);
    if (timeout == ExecutionOptions.DISABLED_NETWORK_BUFFER_TIMEOUT
        || timeout == ExecutionOptions.FLUSH_AFTER_EVERY_RECORD) {
        outputFlusher = null;
    } else {
        String threadName =
            taskName == null
            ? DEFAULT_OUTPUT_FLUSH_THREAD_NAME
            : DEFAULT_OUTPUT_FLUSH_THREAD_NAME + " for " + taskName;

        outputFlusher = new OutputFlusher(threadName, timeout);
        outputFlusher.start();
    }
}

OutputFlusher使用专门的线程,异步定时调用targetPartition的flushAll()方法。调用时间间隔就是setBufferTimeout的值。

@Override
public void run() {
    try {
        while (running) {
            try {
                // 每隔timeout这么长时间,就flush所有的数据
                Thread.sleep(timeout);
            } catch (InterruptedException e) {
                // propagate this if we are still running, because it should not happen
                // in that case
                if (running) {
                    throw new Exception(e);
                }
            }

            // any errors here should let the thread come to a halt and be
            // recognized by the writer
            flushAll();
        }
    } catch (Throwable t) {
        notifyFlusherException(t);
    }
}

到此为止我们分析完了buffer timeout从配置到生成StreamGraph到如何影响Flink发送数据的完整过程。

更多文章请扫码关注公众号,有问题的小伙伴也可以在公众号上提出。
请添加图片描述

  • 28
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值