Flink 流批一体在小米的实践

最新推荐文章于 2023-03-21 20:00:38 发布

米朵儿技术屋

最新推荐文章于 2023-03-21 20:00:38 发布

阅读量169

点赞数 1

分类专栏：综合技术探讨及方案专栏文章标签：大数据

本文链接：https://blog.csdn.net/weixin_70923796/article/details/125755826

版权

68 篇文章 15 订阅 ¥69.90 ¥99.90

订阅专栏

本篇内容主要分为四个部分：

一、小米的大数据发展演变

2019 年之前，小米的实时计算主要以 SparkStreaming 为主，少部分 Storm，离线计算以 Spark 为主。
2019 年，开始接入 Flink，并广泛应用于信息流搜索推荐、广告实时样本、实时 ETL 等场景，逐步替换了原来的 SparkStreaming 作业，得益于 Flink 框架的各种优秀特性，我们在作业的正确性，实时性，资源使用效率方面都有较大提升。
2020 年，开始接入使用 FlinkSQL，并广泛用于实时数仓的建设和实时 ETL 作业的开发。FlinkSQL 的实时数仓将数据链路由 T+1 降低到了秒级。
2021 年，开始接入数据湖 Iceberg，基于 Flink 和 Iceberg 来构建流批一体的实时数仓解决方案，并在小米内部的部分业务进行了落地，证明流批一体在赋能业务、提升作业开发效率、简化链路节省资源的方面是可行的。

了解本专栏

关注