
Flink SQL 任务消费Kafka写hudi的性能调优总结
以上修改后,我们还把checkpoint的间隔时长从10分钟调整为5分钟了,因为现在每分钟从Kafka中消费的数据更多了,如果继续是10分钟的checkpoint间隔时长,则每次做checkpoint时需要写入到HDFS的数据量也会更大,做checkpoint花费的时间也会更久,任务背压的时间也就更长,任务反而不稳定。为了进一步验证我们的想法,我们创建了一个测试任务,消费我们的Kafka,消费的数据直接写入到blackhole连接器中,这样就可以测出Kafka的读取性能而不受其他算子或者网络的影响。







