本文介绍SparkSQL提供的几个数据操作语言(DML)操作,用于与Hudi表交互。这些操作包括插入、更新、合并和删除Hudi表中的数据。
1.Insert Into
使用INSERT INTO语句使用Spark SQL将数据添加到Hudi表中。以下是一些示例:
INSERT INTO <table> SELECT <columns> FROM <source>;
从0.14.0开始,不推荐使用hoodie.sql.bulk.insert.enable和hoodie.sql.insert.mode。用户应该使用hoodie.spark.sql.insert.into.operation。要使用INSERT INTO管理重复项,请查看INSERT dup策略配置。
-- Insert into a copy-on-write (COW) Hudi table
INSERT INTO hudi_cow_nonpcf_tbl SELECT 1, 'a1', 20;
-- Insert into a merge-on
本文详细介绍了如何使用SparkSQL与Hudi表进行数据操作,包括INSERT INTO、INSERT OVERWRITE、UPDATE、MERGE INTO和DELETE FROM等DML语句的用法,以及数据跳过和索引在加速执行中的作用。
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



