前言
笔者针对 Doris 替换 ADB 过程中遇到的一些问题进行记录,总结如下。
一、DDL 改造
- varchar 类型字段定义长度
ADB 中 varchar 类型字段是无需指定存储长度的。
但是 Doris 中 varchar 类型是必须指定长度,若不指定的话,则默认长度为 1 。
由于涉及的表有几百张,针对每个字段去指定对应的长度,工作量太大,索性都定义为统一长度(如 64),在最终执行 Doris 数据插入脚本时再进一步调整。
-
timestamp 类型替换为 datetime 类型(Doris 不支持 TIMESTAMP)。
-
PRIMARY KEY 调整为 UNIQUE KEY ,且放到字段列表括号之外。
-
数据模型指定字段必须与其所在字段列表中的位置、顺序保持一致。
-
表注释定义在数据模型之后
-
分区定义调整:DISTRIBUTED BY HASH(
分区字段
) BUCKETS 分区数量 -
删除表组配置项:TABLEGROUP
-
删除实时更新配置项: OPTIONS (UPDATETYPE=‘realtime’)
二、DML & DQL 改造
-
Doris 不支持 date_parse() 函数,替换为 date_format() 即可。
-
Doris replace() 函数至少有三个参数(同 MySQL),而 ADB replace() 函数可支持两个参数的情况(即:将指定字符串的指定子串替换为空字符串)。
-
Doris DELETE 语句:使用聚合类的表模型(AGGREGATE、UNIQUE)只能指定 key 列上的条件。条件之间不支持使用 OR,可拆分为两条 DELETE 语句来满足要求。
-
Doris group_concat() 函数要求参数必须为字符串类型,而 MySQL 或 ADB MySQL 中 group_concat() 函数可以接收数值类型的参数。
-
Doris get_json_string()、get_json_int() 函数解析并获取 json 字符串内指定路径的字符串内容。