Flink
文章平均质量分 90
涤生大数据
在职阿里,美团,京东,字节大数据技术专家,擅长大数据开发,集群架构/运维,爱好python数据分析/爬虫,
加 v: dsflink 可免费转行评估,职业规划,校招规划,大数据进阶指导,简历把脉
欢迎一起交流
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
放弃Canal后,我们用Flink CDC实现了99.99%的数据一致性
对数据的实时性要求越来越高。传统的离线数仓(T+1)已无法满足业务对秒级响应的需求,而实时数仓和数据湖(Data Lake)架构正成为主流。然而,如何将业务数据库中的变更数据(Insert/Update/Delete)低延迟、高可靠、无侵入地同步到下游系统,一直是构建实时链路的关键挑战。原创 2025-12-21 23:29:41 · 1584 阅读 · 0 评论 -
Flink 流表二象性是什么神仙操作?用SQL处理实时数据原来这么简单
了解Flink SQL大规模应用的奥秘之前,我们先谈谈SQL的流批一体的概念。关于流与批的统一一直是业界非常火热的一个话题,Flink SQL 的流与批统一总结起来就一句话:One Query, One Result。在很多场景,我们既需要批处理,又需要流处理。原创 2025-11-04 22:42:19 · 841 阅读 · 0 评论 -
21世纪了,你还不懂Flink中的触发器(trigger)和驱逐器(evictor)?
在Flink中,使用event-time模式时,默认提供的window有TumblingEventTimeWindows,SlidingEventTimeWindows,EventTimeSessionWindow等,其中这些是属于window operator中的一部分,称作 window assigner。window operator包含四个组件,除了 window assigner外,还包括 trigger、evictor、window process。原创 2025-09-14 21:27:59 · 956 阅读 · 0 评论 -
支付宝智能助理用户会话实时统计:Flink定时器与状态管理实战解析
业务背景:支付宝智能助理上线后,用户只需从支付宝首页轻松下拉即可体验,因此得到了大量用户的使用和反馈。业务需求:现在业务方想统计每个用户在智能助理近30min、近1h、近6h的会话数和会话时长,并随着时间推移,每1分钟更新一次。额外诉求:如果用户在30min、1h、6h后没有行为数据,则将会话数和会话时长清零。原创 2025-07-17 21:05:51 · 647 阅读 · 0 评论 -
FlinkCDC-Hudi数据实时入湖原理篇
面对海量数据开发场景,一种支持存储多种原始数据格式、多种计算引擎、高效的元数据统一管理的存储方式能极大的提高开发效率。原创 2025-06-16 22:04:42 · 1149 阅读 · 0 评论 -
Kafka Streams 和 Apache Flink 的无状态流处理与有状态流处理
Kafka Streams 和 Apache Flink 与数据库和数据湖相比的无状态和有状态流处理的概念和优势。在数据驱动的应用中,流处理的兴起改变了我们处理和操作数据的方式。虽然传统数据库、数据湖和数据仓库对于许多基于批处理的用例来说非常有效,但在要求低延迟、可扩展性和实时决策的场景中,它们显得力不从心。本文以Kafka Streams和Apache Flink为例,探讨无状态和有状态流处理的关键概念。这些原则适用于任何流处理引擎,无论是开源引擎还是云服务引擎。原创 2025-05-24 21:04:49 · 1711 阅读 · 0 评论 -
带你玩转 Flink TumblingWindow:从理论到代码的深度探索
在深入探讨 TumblingWindow 之前,我们先来了解一下流处理或流计算中“窗口”的基本概念。在数据流中,源会持续不断地生成数据,因此计算最终值是不可行的。原创 2025-05-09 00:11:44 · 1418 阅读 · 0 评论
分享