1.1    数据库字段设计规范

优先选择符合存储需要的最小的数据类型

对于非负数据采用无符号整型进行存储;

varchar(N)N代表字符数,不是字节数Oracle中是字节数,如中文GBK2字节存一个汉字),即MySQLvarchar(2)可存储2个汉字,占用6个字节(UTF8)。

避免使用text,blob数据类型:

常见的text类型可存储64k,一般是使用不到这么大空间;

非要使用,建议把blobtext列分离到单独的扩展表中,且避免使用select *;

text, blob仅能使用前缀索引,且默认情况下text,blob列均不能有默认值。

避免使用ENUM数据类型

修改ENUM值需要alter语句;

ENUM类型的ORDER BY操作效率低,需要额外操作;

禁止使用数值作为ENUM的枚举值。

尽可能把所有列定义为NOTNULL

索引NULL列需占用额外的空间来保存(是否为空),所以占用更多空间;

比较和计算对NULL做特别处理,可能索引会失效。

使用TIMESTAMPDATETIME类型存储时间:

TIMESTAMP 1970-01-01~2038-01-19,占用4字节和INT存储相同;

其他范围使用DATETIME类型存储。

金融财务相关类数据,使用DECIMAL类型:

占用空间有定义的宽度决定;

可用于存储比bigint更大的整数数据。

1.2    数据库SQL开发规范

建议使用预编译语句进行数据库操作:

只传参数,比传递SQL语句更高效;

相同语句可以一次解析,多次使用,提高处理效率。

避免数据类型的隐式转换

隐式转换可能导致索引失效。

充分利用表上已存在的索引

避免使用双%的查询条件,如’123%’可使用索引;

一个SQL只能使用联合索引一列进行范围查询;

PSindex(a, b, c)where a = xxand b > low and b < high可使用到b列的索引,

         wherea > low and a < high and b = xxb这列使用不到索引;

         这个处理和oracle的联合索引是一致的。

使用left joinnot exists来优化not in操作。

禁止跨库查询:

程序连接不同数据库使用不同的账号;

为数据库迁移和分库分表留出余地;

降低业务的耦合度;

避免权限过大产生的安全风险,SQL注入也只能看到一个库。

禁止使用Select *

消耗过多的CPU, IO, 网络资源;

无法使用覆盖索引;

可减少表结构变更带来的影响。

禁止使用不含字段列表的INSERT

INSERT INTO T(A, B) VALUES(…….);

可减少表结构变更带来的影响。

尽量避免使用子查询,可以把子查询优化为join操作:

当然并不是所有的子查询都能转换为join,如group by等得子查询;

通常是IN子查询这样的语句。

子查询结果集无法使用索引;子查询会产生临时表操作,如果子查询数据量大将严重影响效率;消耗过多的CPUIO

避免使用JOIN关联太多的表:

Join一个表多占用一部分内存(join_buffer_size;

会产生临时表操作,影响查询效率;

MySQL最多允许关联61个表,建议不超过5个。

减少同数据库的交互次数:

数据库更适合做批量操作;

合并多个相同的操作到一起;

PS:如alter table t addcolumn c1 int, change column c2 c2 int…

使用in代替or

in的值不要超过500个;

in操作可以有效的利用索引。

禁止使用order byrand()进行随机排序:

会把表中所有满足条件的数据装载到内存中进行排序;

消耗大量的CPU/IO/MEM

处理方式:推荐在程序中获取一个随机值,然后在数据库中获取数据的方式(亲认为开发人员愿意去实现多余的算法吗?都希望一句SQL返回结果集)。

WHERE从句禁止对列进行函数转换和计算:

where date(createtime) = ‘20171010’ à where createtime >= ‘20171010’ and createtime < ‘20171011’

UNIONALL OR UNION

这两种排序方式和Oracle的完全一致,UNION ALL不排序,UNION排序。

拆分复杂SQL为多个小SQL

MySQL一个SQL只能使用一个CPU进行计算;

SQL拆分后可以通过并行查询提高处理效率。

1.3    数据库操作行为规范

超过100W行数据批量DML操作,要分批多次进行操作

需考虑主从延迟;

binlog日志为row格式产生大量日志;

避免大事务的操作,阻塞并行。

大表表结构修改

推荐使用pt-online-schema-change修改表结构;

可避免大表修改产生的主动延迟;

避免在对表字段修改时进行锁表。

禁止为程序账号赋予super权限:

当达到最大连接数限制时,还允许使用一个带有super权限的用户连接;

super权限只能留给DBA处理问题的账号使用。

对程序账号,遵循权限最小的原则:

程序在使用数据库账号只能在一个DB下使用,不允许跨库使用;

程序账号原则上不允许有drop权限。