FlinkSQL中的回退更新-Retraction

93 篇文章 9 订阅

 

公众号《大数据技术与架构》,大数据领域高级进阶

已关注

5 人赞同了该文章

前言
如果你在使用FlinkSQL时出现如下的报错:


Table is not an append-only table. Use the toRetractStream() in order to handle add and retract messages.
那么你就有必要了解一下Flink中的回退更新。简介
通俗的讲"回退更新"就是传统数据里面的更新操作,也就是说Retract是流式计算场景下对数据更新的处理。
使用flinkSQL处理实时数据当我们把表转化成流的时候,需要用toAppendStream与toRetractStream这两个方法。稍不注意可能直接选择了toAppendStream。


区别

追加模式:只有在动态Table仅通过INSERT更改修改时才能使用此模式,即它仅附加,并且以前发出的结果永远不会更新。
如果更新或删除操作使用追加模式会失败报错。


缩进模式: 始终可以使用此模式。返回值是boolean类型。它用true或false来标记数据的插入和撤回,返回true代表数据插入,false代表数据的撤回。

按照官网的理解如果数据只是不断添加,可以使用追加模式,其余方式则不可以使用追加模式,而缩进模式侧可以适用于更新,删除等场景。具体的区别如下图所示:


 



通过上图可以清晰的看到两种方式的区别,当我们使用的sql语句包含:count() group by时,必须使用缩进模式。

举个例子
 



上面的例子输出结果如下:
 


前面数字相同的是同一组操作,true代表的是写入,false代表的是撤回。
关于FlinkSQL是如何实现回退更新的,我们会另开文章介绍。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Flink 回撤(retraction)是在流式处理,用于纠正之前错误计算结果的机制。当数据流经过一系列的处理操作后,某些数据的处理结果可能会发生变化,需要对之前的计算结果进行修正。Flink 的回撤机制可以帮助我们有效地处理这种情况。 Flink 回撤的原理是基于增量更新的方式进行的。当一个数据元素经过处理后,产生了新的结果,Flink 会将这个新结果与之前的结果进行比较,如果有变化,则将新结果发送给下游操作,并且对之前的结果进行撤销。这样可以确保之前的错误结果被正确的结果所替代。 在实现回撤的过程Flink 使用了两种类型的记录:正常记录和回撤记录。正常记录用于传递数据流,而回撤记录用于指示之前计算结果的撤销。Flink 的内部处理引擎会根据这两种记录类型进行增量更新和撤销操作,以保证最终的计算结果是正确的。 值得注意的是,Flink 回撤机制的性能表现非常好,因为它能够利用数据流的特性进行增量更新,而不需要重新计算所有的数据。这使得 Flink 在处理大规模数据时能够做到高效和快速地修正之前的错误计算结果。 总之,Flink 回撤的原理是基于增量更新和撤销操作,通过对比新的计算结果和之前的结果,保证最终的计算结果是准确的。这种机制在流式处理非常重要,可以帮助我们处理数据计算过程可能出现的误差和错误。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值