【doris】TPC-H导入customer.tbl本地数据到customer表

说明:doris的curl 命令导入本地文件,每个文件的大小建议在1~2G之间,生成的TPC-H的1T数据,customer的表数据行数为153600000,总大小为24G,因此需要将customer的文件拆分为小文件,并利用curl的命令导入。

1、customer的文件拆分

(1)查看文件的大小
root@op-service:/home/tpch1t# du -sh customer.tbl
24G     customer.tbl
(2)拆分文件,此命令的用法可见文章:

将customer拆分为多个小文件,每个文件500万行,将会生成30个小文件

split -a3 -l 5000000 -d customer.tbl customer/customer-
(3)拆分后的显示
root@op-qa-worker:/syw/customer# ll
total 24640092
drwxr-xr-x 2 root root      4096 Mar  7 10:52 ./
drwxr-xr-x 3 root root      4096 Mar  7 10:49 ../
-rw-r--r-- 1 root root 813791778 Mar  7 10:49 customer-000.tbl
-rw-r--r-- 1 root root 814790497 Mar  7 10:49 customer-001
-rw-r--r-- 1 root root 819907996 Mar  7 10:49 customer-002
-rw-r--r-- 1 root root 819972306 Mar  7 10:49 customer-003
-rw-r--r-- 1 root root 819859048 Mar  7 10:49 customer-004
-rw-r--r-- 1 root root 820130300 Mar  7 10:49 customer-005
-rw-r--r-- 1 root root 819848121 Mar  7 10:49 customer-006
-rw-r--r-- 1 root root 819916437 Mar  7 10:49 customer-007
-rw-r--r-- 1 root root 819877928 Mar  7 10:49 customer-008
-rw-r--r-- 1 root root 820106148 Mar  7 10:49 customer-009
-rw-r--r-- 1 root root 819984680 Mar  7 10:49 customer-010
-rw-r--r-- 1 root root 819955439 Mar  7 10:49 customer-011
-rw-r--r-- 1 root root 819943274 Mar  7 10:49 customer-012
-rw-r--r-- 1 root root 819941317 Mar  7 10:49 customer-013
-rw-r--r-- 1 root root 819977248 Mar  7 10:49 customer-014
-rw-r--r-- 1 root root 819879330 Mar  7 10:49 customer-015
-rw-r--r-- 1 root root 819998061 Mar  7 10:49 customer-016
-rw-r--r-- 1 root root 819927193 Mar  7 10:49 customer-017
-rw-r--r-- 1 root root 819985981 Mar  7 10:49 customer-018
-rw-r--r-- 1 root root 819918959 Mar  7 10:49 customer-019
-rw-r--r-- 1 root root 824934822 Mar  7 10:49 customer-020
-rw-r--r-- 1 root root 824903203 Mar  7 10:49 customer-021
-rw-r--r-- 1 root root 824877629 Mar  7 10:50 customer-022
-rw-r--r-- 1 root root 824903800 Mar  7 10:50 customer-023
-rw-r--r-- 1 root root 825023618 Mar  7 10:50 customer-024
-rw-r--r-- 1 root root 824987190 Mar  7 10:50 customer-025
-rw-r--r-- 1 root root 824854649 Mar  7 10:50 customer-026
-rw-r--r-- 1 root root 825067703 Mar  7 10:50 customer-027
-rw-r--r-- 1 root root 824985996 Mar  7 10:50 customer-028
-rw-r--r-- 1 root root 824900754 Mar  7 10:50 customer-029
-rw-r--r-- 1 root root 594112890 Mar  7 10:50 customer-030

导入数据

(1)导入的命令
curl --location-trusted -u root:Aa123456  -T /syw/customer/customer-001 -H "label:9"  -H "column_separator:|" http://192.168.48.71:8030/api/syw/customer/_stream_load

用法解读

curl --location-trusted 
-u root:Aa123456(用户名:密码 ) 
-T /syw/customer/customer-001(存放数据的路径)
-H "label:9" (唯一标识,每次导入改为不一样的值,可直接利用这里给出的格式)  
-H "column_separator:|"  (字段的分割方式)
http://192.168.48.71:8030/api/syw/customer/_stream_load   (http://IP地址:端口/api/库名/表名/_stream_load),8030是默认的端口
(2)导入成功后的显示
root@op-qa-worker:/syw/customer# curl --location-trusted -u root:Aa123456  -T /syw/customer/customer-001 -H "label:9"  -H "column_separator:|" http://192.168.48.71:8030/api/syw/customer/_stream_load
{
    "TxnId": 2,
    "Label": "9",
    "TwoPhaseCommit": "false",
    "Status": "Success",
    "Message": "OK",
    "NumberTotalRows": 5000000,
    "NumberLoadedRows": 5000000,
    "NumberFilteredRows": 0,
    "NumberUnselectedRows": 0,
    "LoadBytes": 814790497,
    "LoadTimeMs": 13230,
    "BeginTxnTimeMs": 25,
    "StreamLoadPutTimeMs": 213,
    "ReadDataTimeMs": 9719,
    "WriteDataTimeMs": 12937,
    "CommitAndPublishTimeMs": 53
}
mysql> select count(*) from customer;
+----------+
| count(*) |
+----------+
|  5000000 |
+----------+
1 row in set (0.10 sec)

此时则说明第一个小文件customer-000的数据被成功导入,接着修改文件名继续导入即可

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这个错误是由于环境变量设置不正确引起的。在配置文件`/opt/software/apache-doris-0.15.0-incubating-src/env.sh`的第96行,使用了`/usr/lib/jvm/java-1.8.0/bin/javap`这个路径,但是该路径下没有`javap`这个文件或目录,导致出现了"No such file or directory"的错误信息。 要解决这个问题,你可以按照以下步骤进行操作: 1. 首先,确认你的机器上已经安装了Java 8版本。可以使用命令`java -version`来查看当前的Java版本。 2. 如果你的机器上没有安装Java 8,那么你需要先安装Java 8,并将其添加到环境变量中。你可以通过访问Java官方网站下载并安装Java 8。 3. 安装完Java 8后,你需要将Java 8的路径添加到环境变量中。可以通过编辑`/opt/software/apache-doris-0.15.0-incubating-src/env.sh`文件,在第96行的`/usr/lib/jvm/java-1.8.0/bin/javap`路径修改为Java 8的正确路径。 4. 保存文件并退出编辑器。 5. 然后,执行`source /opt/software/apache-doris-0.15.0-incubating-src/env.sh`命令,使环境变量生效。 6. 最后,再次运行你的程序,应该就不会再出现该错误了。 通过以上步骤,你应该能够解决`/opt/software/apache-doris-0.15.0-incubating-src/env.sh: line 96: /usr/lib/jvm/java-1.8.0/bin/javap: No such file or directory`的错误。如果仍然有问题,请检查Java 8的安装和环境变量配置是否正确。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [超强总结,用心分享丨大数据超神之路(七):Apache Doris上篇](https://blog.csdn.net/Mrxuchen/article/details/126187392)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值