Flink的八种分区策略源码解读

Flink包含8中分区策略,这8中分区策略(分区器)分别如下面所示,本文将从源码的角度一一解读每个分区器的实现方式。

  • GlobalPartitioner
  • ShufflePartitioner
  • RebalancePartitioner
  • RescalePartitioner
  • BroadcastPartitioner
  • ForwardPartitioner
  • KeyGroupStreamPartitioner
  • CustomPartitionerWrapper

继承关系图

接口

名称

ChannelSelector

实现
public interface ChannelSelector<T extends IOReadableWritable> {
   

	/**
	 * 初始化channels数量,channel可以理解为下游Operator的某个实例(并行算子的某个subtask).
	 */
	void setup(int numberOfChannels);

	/**
	 *根据当前的record以及Channel总数,
	 *决定应将record发送到下游哪个Channel。
	 *不同的分区策略会实现不同的该方法。
	 */
	int selectChannel(T record);

	/**
	*是否以广播的形式发送到下游所有的算子实例
	 */
	boolean isBroadcast();
}

抽象类

名称

StreamPartitioner

实现
public abstract class StreamPartitioner<T> implements
		ChannelSelector<SerializationDelegate<StreamRecord<T>>>, Serializable {
   
	private static final long serialVersionUID = 1L;

	protected int numberOfChannels;

	@Override
	public void setup(int numberOfChannels) {
   
		this.numberOfChannels = numberOfChannels;
	}

	@Override
	public boolean isBroadcast() {
   
		return false;
	}

	public abstract StreamPartitioner<T> copy();
}

继承关系图

在这里插入图片描述

GlobalPartitioner

简介

该分区器会将所有的数据都发送到下游的某个算子实例(subtask id = 0)

源码解读

/**
 * 发送所有的数据到下游算子的第一个task(ID = 0)
 * @param <T>
 */
@Internal
public class GlobalPartitioner<T> extends StreamPartitioner<T> {
   
	private static final long serialVersionUID = 1L;

	@Override
	public int selectChannel(SerializationDelegate<StreamRecord<T>> record) {
   
		//只返回0,即只发送给下游算子的第一个task
		return 0;
	}

	@Override
	public StreamPartitioner<T> copy() {
   
		return this;
	}

	@Override
	public String toString() {
   
		return "GLOBAL";
	}
}

图解

在这里插入图片描述

ShufflePartitioner

简介

随机选择一个下游算子实例进行发送

源码解读

/**
 * 随机的选择一个channel进行发送
 * @param <T>
 */
@Internal
public class ShufflePartitioner<T> extends StreamPartitioner<T> {
   
	private static final long serialVersionUID = 1L;

	private Random random = new Random();

	@Override
	public int selectChannel(SerializationDelegate<StreamRecord<T>> record) {
   
		//产生[0,numberOfChannels)伪随机数,随机发送到下游的某个task
		return random.nextInt(numberOfChan
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值