Hudi 清理器的是怎么工作的?

Hudi清理器在提交和增量提交后删除不再需要的文件。为保证数据完整性和作业不失败,需确保保留足够的最近提交用于回溯,并考虑任务运行时间和频率对清理器配置的影响。默认配置为10个提交,每30分钟运行一次,保留5小时数据。
摘要由CSDN通过智能技术生成

Hudi 清理器的是怎么工作的?

官方译文:
  • Hudi清理器的作用是在提交(commit)和增量提交(deltacommit)后运行,用于删除不再需要的旧文件。如果您正在使用增量拉取功能,请确保配置清理器以保留足够数量的最近提交以进行回溯。另一个考虑因素是为长时间运行的作业提供足够的时间来完成运行。否则,清理器可能会删除正在被作业读取或可能被作业读取的文件,导致作业失败。通常,默认配置为10,允许每30分钟运行一次的摄入任务保留长达5小时的数据。如果您更频繁地运行摄入任务,或者希望为查询提供更多运行时间,请考虑增加配置值:hoodie.cleaner.commits.retained。

Hudi官方原文链接:https://hudi.apache.org/cn/docs/faq_table_services

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

公子乂

你的鼓励是我创作的大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值