导入60G的CSV文件数据到clickhouse报错

一般导入csv到clickhouse报错都是数据格式有问题,解决办法可忽略错误

修改config.xml,添加下面配置:

<input_format_allow_errors_num>100</input_format_allow_errors_num>

clickhouse-client --input_format_allow_errors_num=1  --input_format_allow_errors_ratio=0.1 --password default --query "insert into tb FORMAT CSV" --max_insert_block_size=100000 < data_csv

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
导入CSV文件ClickHouse,可以使用ClickHouse客户端命令行工具或者使用HTTP接口。以下是使用ClickHouse客户端命令行工具的步骤: 1. 确保CSV文件符合ClickHouse的要求,包括文件编码、字段分隔符和换行符等。可以在文件头部指定这些参数。例如: ``` #encoding=UTF-8 #field_separator=, #line_separator=\n ``` 2. 登录到ClickHouse客户端。 3. 使用以下命令创建表: ``` CREATE TABLE table_name (column1 type1, column2 type2, ...) ENGINE = Log; ``` 其中,table_name是要创建的表名,column1、column2等是表的列名,type1、type2等是列的数据类型,Log是存储引擎。 4. 使用以下命令导入数据: ``` INSERT INTO table_name FORMAT CSV < 'file_path'; ``` 其中,table_name是要导入数据的表名,file_path是CSV文件的路径。 5. 导入完成后,使用以下命令查询数据: ``` SELECT * FROM table_name; ``` 以上是使用ClickHouse客户端命令行工具导入CSV文件的步骤。如果要使用HTTP接口导入CSV文件,可以使用以下请求: ``` POST /?query=INSERT%20INTO%20table_name%20FORMAT%20CSV HTTP/1.1 Host: localhost:8123 Content-Type: text/csv column1,column2,... value1,value2,... value3,value4,... ``` 其中,table_name是要导入数据的表名,column1、column2等是表的列名,value1、value2等是要导入数据。需要注意的是,HTTP请求体中的数据必须是CSV格式,并且每行数据末尾不能有换行符。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值