本文介绍SparkSQL提供的几个数据操作语言(DML)操作,用于与Hudi表交互。这些操作包括插入、更新、合并和删除Hudi表中的数据。
1.Insert Into
使用INSERT INTO语句使用Spark SQL将数据添加到Hudi表中。以下是一些示例:
INSERT INTO <table> SELECT <columns> FROM <source>;
从0.14.0开始,不推荐使用hoodie.sql.bulk.insert.enable和hoodie.sql.insert.mode。用户应该使用hoodie.spark.sql.insert.into.operation。要使用INSERT INTO管理重复项,请查看INSERT dup策略配置。
-- Insert into a copy-on-write (COW) Hudi table
INSERT INTO hudi_cow_nonpcf_tbl SELECT 1, 'a1', 20;
-- Insert into a merge-on