目录
规范整理,以做知识沉淀,如有错误请指正~
一、字符集规范
【强制】数据库字符集指定utf-8,并且只支持utf-8。
1)【建议】库名统一使用小写方式,中间用下划线(_)分割,长度62字节内
2)【建议】表名称大小写敏感,统一使用小写方式并且不可修改,中间用下划线(_)分割,长度64字节内。
二、建表规范
1)【强制】确保每个tablet大小为1-3G之间。举例:假设表内单分区数据量在100G,按天分区,bucket数量100个。
2)【强烈建议】不要使用Auto Bucket 自动分桶,按照自己的数据量来进行分区分桶,这样导入及查询性能都会得到很好的效果,Auto Bucket会造成 tablet 数量过多,造成大量小文件的问题。
3)【分区分桶】5 亿以上的数据必须设置分区分桶策略。
- 没有办法分区的,数据又缓慢增长的:单个tablet数据量保