1. 元数据定义
1.1 CSV 文件
要想将 CSV 集成到 Calcite 当中,首先要让 Calcite 能够识别这些文件,但是 Calcite 并不知道这些文件是什么,因此需要对 CSV 文件的格式进行定义。CSV 文件的第一行是元数据信息,采用 FieldName1:FieldType,FieldNameN:FieldType
的格式存储,跟 Excel 中的表头信息比较类似,通过这种方式告诉 Calcite 文件的字段名称和字段类型。如下是 sales.csv
的示例:
DEPTNO:int,NAME:string
10,"Sales"
20,"Marketing"
30,"Accounts"
1.2 配置文件
有了 CSV 文件之后,我们需要定义一个 model
模型配置文件,如下所示:
{
"version": "1.0"