Parquet输入输出格式
支持Parquet格式的导出和导入。
Parquet和ClickHouse类型的匹配关系
不支持的Parquet数据类型:DATE32, TIME32, FIXED_SIZE_BINARY, JSON, UUID, ENUM。
注意:
- ClickHouse表的列名必须与Parquet表的列名一致。
- ClickHouse表的列数据类型可以不同于插入的Parquet数据类型。 在插入数据时, ClickHouse根据上表解释数据类型, 然后将数据类型转换为ClickHouse表的列数据类型。
数据的导出:
备注:表随便找一张
命令:clickhouse-client --query="SELECT * FROM tutorial.tsv_demo FORMAT Parquet" > parquet_demo.parquet
数据的导入:
创建测试表:
命令:create table parquet_demo (srcip String, destip String, time String) ENGINE=TinyLog;
导入命令:
cat parquet_demo.parquet | clickhouse-client --query="INSERT INTO parquet_demo FORMAT Parquet"