1 不同类型的正确性
1.1 计算窗口和会话窗口
通过点击流追踪网站3个访问者
描述:对于每个访问者来说,活动是不连续的。在访问时间段内,事件数据被收集起来;当访问者起身去喝茶或喝咖啡时,或者当他们因为老板从身边经过而切换回工作页面时,数据就产生了间隙
采用微批处理方法时,很难使计算窗口(虚线所示)与会话窗口(长方形所示)吻合
Flink 的流处理能力能够使计算窗口与会话窗口吻合
1.2 事件时间
事件时间指的是事件发生的时间;处理时间指的是事件流被程序处理的时间
使用事件时间可以让很多计算工作变得更好,而Flink具备了这种理解事件时间的能力
1.3 发生故障后保证正确性是如何做到的
Flink保证正确性的方法是使用了检查点(checkpoint) ,检查点会准确记录中间计算状态,以便在发生故障时可以进行重置,除此之外,这种机制还可以用于重播重新处理事件流
2 参考
《Flink基础教程》
如果你觉得文章还可以,欢迎点赞,评论,转发,收藏,关注哦!