Apache Doris 提供了多种数据导入方式

Apache Doris 提供了多种数据导入方式,涵盖了实时写入、流式同步、批量导入以及外部数据源集成等场景。以下是几种常见的 Doris 数据加载方式:

  1. Stream Load:通过 HTTP 协议同步写入本地文件或应用程序数据。适用于中小规模数据导入,支持 csv、json、parquet、orc 格式的数据文件。

  2. Broker Load:通过 Broker 进程异步从外部存储系统(如 S3、HDFS)批量导入数据。这种方式支持的数据格式包括 csv、json、parquet、orc,并且可以处理数十GB到数百GB的数据量。

  3. Routine Load:用于从 Kafka 等实时数据流中导入数据。Doris 会调度任务将 Kafka 中的数据拉取并写入,支持 csv、json 格式的数据。

  4. INSERT INTO SELECT:通过 SQL 语句将数据从外部表或者对象存储、HDFS 中同步导入到 Doris 表中。

  5. MySQL Load:通过 JDBC 接口从 MySQL 数据库导入数据。

  6. Group Commit:针对高并发小批量数据写入的优化,使用 JDBC INSERT 或 Stream Load 写入数据。

  7. 外部数据源集成:通过创建 Catalog 读取外部数据源中的数据,并使用 INSERT INTO SELECT 将数据同步写入到 Doris 表中。

每种加载方式都有其适用场景和限制,例如 Stream Load 适合于小于10GB的同步导入,而 Broker Load 适合于数十GB到数百GB的异步导入。选择合适的加载方式可以有效提升数据导入的效率和稳定性。

此外,Doris 还提供了一些工具和连接器来简化数据加载流程,比如 Doris Streamloader,它支持并行加载、多文件及目录支持、路径遍历能力、故障恢复与连续性、智能重试机制等特点。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值