Doris 提供多种方式从本地数据导入:
- Stream Load
Stream Load 是通过 HTTP 协议将本地文件或数据流导入到 Doris 中。Stream Load 是一个同步导入方式,执行导入后返回导入结果,可以通过请求的返回判断导入是否成功。支持导入 CSV、JSON、Parquet 与 ORC 格式的数据。更多文档参考stream load。
- streamloader
Streamloader工具是一款用于将数据导入 Doris 数据库的专用客户端工具,底层基于Stream Load实现,可以提供多并发导入的功能,降低大数据量导入的耗时。支持并发导入CSV格式的数据,导入其他格式(JSON、Parquet 与 ORC )时,可以同时导入多个文件,但是无法并发。更多文档参考Streamloader。
- MySQL Load
Doris 兼容 MySQL 协议,可以使用 MySQL 标准的 LOAD DATA 语法导入本地文件。MySQL Load 是一种同步导入方式,执行导入后即返回导入结果,主要适用于导入客户端本地 CSV 文件。更多文档参考mysql load。
使用 Stream Load 导入
第 1 步:准备数据
创建 CSV 文件 streamload_example.csv
,内容如下:
1,Emily,25
2,Benjamin,35
3,Olivia,28
4,Alexander,60
5,Ava,17
6,William,69
7,Sophia,32
8,James,64
9,Emma,37
10,Liam,64