数据库命令规范
-
所有数据库对象名称必须使用小写字母并用下划线分
-
所有数据库对象名称禁止使用MySQL关键字,如果表名中包含关键字查询时,需要将其使用单引号括起来
-
数据库对象的命名要能做到见名知意,不能超过32字符
- 临时库存表以tmp_为前缀,以时间为后缀 备份表必须以bak_为前缀并以日期为后缀
- 所有存储相同的列名和列类型必须保持一致
- 一般作为关联列,如果查询时关联的类型不一致会自动进行隐式转换,造成列上的索引失效,导致查询效率低下
数据库基本设计规范
-
所有表必须使用 Innodb 存储引擎
- Innodb 支持事务,支持行级锁,更好的恢复性,高并发下性能更好
-
数据库和表的字符集统一使用 UTF8
-
统一字符集可以避免由于字符集转换产生的乱码,
-
不同的字符集进行比较前需要进行转换会造成索引失效,
-
如果数据库中有存储 emoji 表情的需要,字符集需要采用 utf8mb4 字符集。
-
-
所有表和字段都需要添加注释
- 使用 comment 从句添加表和列的备注,从一开始就进行数据字典的维护
-
尽量控制单表数据量的大小,建议控制在 500 万以内。
-
500 万并不是 MySQL 数据库的限制,
-
过大会造成修改表结构,备份,恢复都会有很大的问题。
-
可以用历史数据归档(应用于日志数据),分库分表(应用于业务数据)等手段来控制数据量大小
-
-
谨慎使用 MySQL 分区表
-
分区表在物理上表现为多个文件,在逻辑上表现为一个表;
-
谨慎选择分区键,跨分区查询效率可能更低;
-
建议采用物理分表的方式管理大数据。
-
-
尽量做到冷热数据分离,减小表的宽度
- MySQL 限制每个表最多存储 4096 列,并且每一行数据的大小不能超过 65535 字节。
-
禁止在表中建立预留字段
-
预留字段的命名很难做到见名识义。
-
预留字段无法确认存储的数据类型,所以无法选择合适的类型。
-
对预留字段类型的修改,会对表进行锁定
-
-
禁止在数据库中存储图片,文件等大的二进制数据
-
通常文件很大,会短时间内造成数据量快速增长,数据库进行数据库读取时,通常会进行大量的随机 IO 操作,文件很大时,IO 操作很耗时。
-
通常存储于文件服务器,数据库只存储文件地址信息
-
-
禁止在线上做数据库压力测试
-
禁止从开发环境,测试环境直接连接生产环境数据库
数据库字段设计规范
-
优先选择符合存储需要的最小的数据类型
- 原因
- 列的字段越大,建立索引时所需要的空间也就越大,这样一页中所能存储的索引节点的数量也就越少也越少,
- 在遍历时所需要的 IO 次数也就越多,索引的性能也就越差。
- 方法
- 将字符串转换成数字类型存储,如:将 IP 地址转换成整形数据
- MySQL提供了两个方法来处理IP地址
- inet_aton 把 ip 转为无符号整型 (4-8 位)
- inet_ntoa 把整型的 ip 转为地址
- MySQL提供了两个方法来处理IP地址
- 对于非负型的数据 (如自增 ID,整型 IP) 来说,要优先使用无符号整型来存储
- 无符号相对于有符号可以多出一倍的存储空间
SIGNED INT -2147483648~2147483647 UNSIGNED INT 0~4294967295
- 无符号相对于有符号可以多出一倍的存储空间
- 将字符串转换成数字类型存储,如:将 IP 地址转换成整形数据
- 原因
-
避免使用 TEXT,BLOB 数据类型,最常见的 TEXT 类型可以存储 64k 的数据
-
避免使用 ENUM 类型
-
尽可能把所有列定义为 NOT NULL
-
使用 TIMESTAMP(4 个字节) 或 DATETIME 类型 (8 个字节) 存储时间
-
同财务相关的金额类数据必须使用 decimal 类型