点击上方 "云祁的数据江湖"关注, 星标一起成长
大家好,我是云祁!某大厂资深数据老兵。
1. 概述
我们用一句话来概括数据湖 Paimon 的话,Paimon 是一种湖格式,它支持使用 Flink 和 Spark 为流处理和批处理操作构建实时湖仓架构。它创新性地将 LSM Tree 与湖格式相结合,将实时流更新引入湖架构。
Apache Paimon (后简称 Paimon)起源于 Apache Flink (后简称 Flink)的一个子项目,起初它只是 Flink 内置的 Table Store 的一个格式,经过了几年的发展后,在 2024 年成功从 Apache 软件基金会(ASF)孵化器毕业,成为