Flink
文章平均质量分 51
wangxiaowu_001
这个作者很懒,什么都没留下…
展开
-
大数据之无界数据流和有界数据流
无界流:有一个开始但是没有结束,不会在生成时终止并提供数据,必须连续处理无界流,也就是说必须在获取后立即处理event。对于无界数据流我们无法等待所有数据都到达,因为输入是无界的,并且在任何时间点都不会完成。处理无界数据流通常要求以特定顺序(例如事件发生的顺序)获取event,以便能够推断结果完整性。有界数据流:有界数据流有明确定义的开始和结束,可以在执行任何计算之前通过获取所有数据来处理有界流,处理有界流不需要有序获取,因为可以始终对有界数据集进行排序,有界流的处理也称为批处理。...原创 2021-10-24 19:20:01 · 2445 阅读 · 0 评论 -
Flink的状态一致性的相关总结
当在分布式系统中引入状态时,自然也引入了一致性问题。一致性实际上是"正确性级别"的另一种说法,也就是说在成功处理故障并恢复之后得到的结果,与没有发生任何故障时得到的结果相比,前者到底有多正确?举例来说,假设要对最近一小时登录的用户计数。在系统经历故障之后,计数结果是多少?如果有偏差,是有漏掉的计数还是重复计数?1、一致性级别在流处理中,一致性可以分为3个级别:at-most-once: 故障发生后,计数结果可能丢失 at-least-once: 计算程序在发生故障后可能重复计算,但是绝不会少算转载 2021-10-13 20:01:52 · 117 阅读 · 0 评论