![在这里插入图片描述](https://img-blog.csdnimg.cn/a817855c83f14355848e8ff599a58923.jpg?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5Lmd5biI5YWE,size_20,color_FFFFFF,t_70,g_se,x_16)
1.概述
首先说说我对flink key state 多年的误解。以前我一直以为key State是类似这样的
假设数据如上,我原先以为当数据经过key的时候,流经下游的时候,数据是在下游根据key分组,如果key不存在,那么就增加一个key,如果存在,那么就放到一起,然后计算存储一个state,因此key state 每个不同的key之间是隔离的。
我这里错误的理解每个key在每个算子的每个并行度的task上,都会有一份或者平分,key1在并行度1上,key2在并行度2上。
这里这样理解有错误的,可以参考文章:【Flink】Flink Key State 和