流式数据湖平台实战 | HudiSQL DML

本文详细介绍了如何使用SparkSQL与Hudi表进行数据操作,包括INSERT INTO、INSERT OVERWRITE、UPDATE、MERGE INTO和DELETE FROM等DML语句的用法,以及数据跳过和索引在加速执行中的作用。
摘要由CSDN通过智能技术生成

本文介绍SparkSQL提供的几个数据操作语言(DML)操作,用于与Hudi表交互。这些操作包括插入、更新、合并和删除Hudi表中的数据。

1.Insert Into

使用INSERT INTO语句使用Spark SQL将数据添加到Hudi表中。以下是一些示例:

INSERT INTO <table>  SELECT <columns> FROM <source>;

从0.14.0开始,不推荐使用hoodie.sql.bulk.insert.enable和hoodie.sql.insert.mode。用户应该使用hoodie.spark.sql.insert.into.operation。要使用INSERT INTO管理重复项,请查看INSERT dup策略配置。

-- Insert into a copy-on-write (COW) Hudi table
INSERT INTO hudi_cow_nonpcf_tbl SELECT 1, 'a1', 20;

-- Insert into a merge-on
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shangjg3

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值