flink uv计算方案

本文介绍了使用Flink进行实时数据去重的两种方案:1) 设定1天窗口,利用RoaringBitmap状态和countTrigger实现去重,并将结果存储到Doris进行UV计算;2) 5分钟窗口内,使用RoaringBitmap序列化字符串,数据存储后由后端接口计算5min粒度的UV。对于倾斜问题,采用两阶段发送策略。
摘要由CSDN通过智能技术生成

1、flink去重+doris uv计算方案,
流定义1day的窗口时间,在窗口中维护一个RoaringBitmap状态,自定义trigger为countTrigger, 来一个数据触发一次,之后如果user_id在状态中存在则不往下游发送。最后所有的数据都sink doris中,由doris来计算实时uv。
1.1倾斜的话,就两阶段发送,第一阶段key+盐, 第二阶段去掉盐
 

2、flink 5分钟窗口去重 + key value为user_id组成的RoaringBitmap的序列化字符串。
每个时间段append到下游的存储引擎中
最后由后端接口,来计算粒度为5min的任意时间段的uv

3、

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值