1、flink去重+doris uv计算方案,
流定义1day的窗口时间,在窗口中维护一个RoaringBitmap状态,自定义trigger为countTrigger, 来一个数据触发一次,之后如果user_id在状态中存在则不往下游发送。最后所有的数据都sink doris中,由doris来计算实时uv。
1.1倾斜的话,就两阶段发送,第一阶段key+盐, 第二阶段去掉盐
2、flink 5分钟窗口去重 + key value为user_id组成的RoaringBitmap的序列化字符串。
每个时间段append到下游的存储引擎中
最后由后端接口,来计算粒度为5min的任意时间段的uv
3、