本文介绍了如何在Spark中集成和使用Hudi。使用Spark数据源API(scala和python)或者SparkSQL,插入、更新、删除和查询Hudi表数据。
1.安装
Hudi适用于Spark-2.4.3+和Spark 3.x版本。
1.1 Spark 3支持矩阵
| Hudi |
Supported Spark 3 version |
本文详述如何在Spark环境中安装、启动Hudi,并通过Scala、PySpark和Spark SQL进行数据的插入、查询、更新、删除操作,以及利用Hudi的Time Travel查询、增量查询和CDC功能。
本文介绍了如何在Spark中集成和使用Hudi。使用Spark数据源API(scala和python)或者SparkSQL,插入、更新、删除和查询Hudi表数据。
Hudi适用于Spark-2.4.3+和Spark 3.x版本。
| Hudi |
Supported Spark 3 version |
1410
340

被折叠的 条评论
为什么被折叠?