解决数据乱序的问题的三种窗口机制
1、设定固定时间间隔的session窗口: 理论顺序为a,b,c,d
每个session窗口是存在间隔的,计算这个间隔合理值,如果为1小时,则窗口实例在1小时之内,窗口d之后的1小时没有观察到更早的数据,则计算这个窗口中的值,劣势在与需要多等待1小时才能得到计算的结果
2、设置watermark
3、利用触发器实时生成近似结果
流式处理中如何处理数据乱序问题
最新推荐文章于 2023-09-01 12:37:52 发布
解决数据乱序的问题的三种窗口机制
1、设定固定时间间隔的session窗口: 理论顺序为a,b,c,d
每个session窗口是存在间隔的,计算这个间隔合理值,如果为1小时,则窗口实例在1小时之内,窗口d之后的1小时没有观察到更早的数据,则计算这个窗口中的值,劣势在与需要多等待1小时才能得到计算的结果
2、设置watermark
3、利用触发器实时生成近似结果