- 无状态计算:对于一条数据处理后,就输出了,没有保存状态
- 有状态计算:对于一条数据处理后,更新已有的状态,这里给一个例子,比如计算一个小时内的温度的最高值,在处理数据过程中根据处理的数据,不断更新当前的最大温度值
- 数据一致性的三个级别: at least one 数据可能计多
- 数据一致性的三个级别: at monst one 数据可能计少
- 数据一致性的三个级别: exactly-one 数据准确
- 检查点机制:检查点机制是实现exactly-one的重要方式,相当于是程序运行在某一时刻的快照,给个例子,
还是以计算一个小时的温度最高值来看,假设在每分钟处理一条数据,在处理完第12条数据时,当时的最高温度是39度,这时候做一个快照,然后继续处理,在处理15条数据的时候失败了,可以从12数据这个检查点重新开始处理数据