Hudi 表支持多种查询引擎对比

Hudi 表支持多种查询引擎对比

Apache Hudi有两种主要的表类型,分别是Copy on Write(COW)表和Merge on Read(MOR)表。

  1. Copy on Write(COW)表

    • 特点COW表在写入新数据时会创建一个全新的数据文件,保留历史版本的数据文件不变。每次写入都会生成新的数据文件,因此数据不会被覆盖,保证了数据的完整性和可追溯性。
    • 使用场景:适用于需要保留完整历史数据版本的场景,如数据仓库、数据湖等,能够提供数据版本管理和数据回滚功能。
  2. Merge on Read(MOR)表

    • 特点MOR表在写入新数据时会先将数据写入临时文件,然后通过Compaction过程将临时文件合并到基础数据文件中,更新数据文件并删除旧版本。这种方式可以减少写入时的开销,提高写入性能。
    • 使用场景:适用于需要高性能写入和查询的场景,如实时数据分析、流式数据处理等,能够提供高效的数据写入和查询能力。
COW 表支持多种查询引擎对比
查询引擎快照查询增量查询
HiveYY
Spark SQLYY
Flink SQLYN
PrestoDBYN
TrinoYN
AWS AthenaYN
BigQueryYN
ImpalaYN
Redshift SpectrumYN
DorisYN
StarRocksYN
ClickHouseYN
MOR 表支持多种查询引擎对比
查询引擎快照查询增量查询读优化查询
HiveYYY
Spark SQLYYY
Spark DatasourceYYY
Flink SQLYYY
PrestoDBYNY
AWS AthenaYNY
Big QueryYNY
TrinoNNY
ImpalaNNY
Redshift SpectrumNNY
DorisNNN
StarRocksYNY
ClickHouseNNN

通过选择合适的表类型,可以根据不同的需求和场景来平衡数据的一致性、可靠性以及性能需求,从而更好地利用 Apache Hudi 来管理和处理数据。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

公子乂

你的鼓励是我创作的大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值