上一篇《阿里巴巴MySQL建表规范》,有些童鞋在后台吐槽,说内容太基础,不符合“架构师”的水准,建议我别再发布小白内容了。
内容不宜只发一半,阿里MySQL规范,除了《阿里巴巴MySQL建表规范》中提到的建表规范10条,还有索引规范4条,以及SQL规范9条。见下,希望能帮助到大家。
画外音:这里指的强制规范,不包含推荐规范与参考规范。
【索引强制规范4条】
索引强制规范一:唯一索引规范
1. 业务上具备唯一特性的字段,即使是组合字段,也必须建立成唯一索引。
画外音:
1. 唯一索引虽然影响插入速度,但针对于互联网大数据量高并发量的数据存储场景来说,插入的影响可以忽略不计,查询效率的提升是主要矛盾;
2. 应用层的唯一检查是不够的;
索引强制规范二:join规范
1. 超过三个表时,禁止join;
2. 需要join的字段,数据类型必须绝对一致;
3. 被关联的字段必须要有索引;
画外音:
1. 针对于互联网大数据量高并发量的数据存储场景来说,join对性能的潜在影响较大;
2. 数据类型不对,没有索引,对性能的潜在影响较大;
索引强制规范三:varchar规范
1. 没有必要对过长的varchar全字段建立索引;
2. varchar字段上的索引必须指定索引长度;
3. 索引长度可参考文本区分度,索引长度N可用count(distinct left(column, N))/count(*)来测试;
画外音:
1. 基于性能考虑;
索引强制规范四:模糊搜索规范
1. 禁止左模糊或者全模糊查询;
2. 如果有相关业务需求,必须走搜索引擎方案解决;
画外音:
1. 基于性能考虑;
【SQL强制规范9条】
SQL强制规范一:count规范
1. 不要使用count(column)或者count(1),请使用count(*)
画外音:
1. count(*)是SQL92标准定义的统计行的语法,与数据库无关,与值无关;
2. count(*)会统计值为NULL的行,count(column)不会;
SQL强制规范二:count规范
1. 如果要计算排除NULL值的不重复行计数,请使用count(distinct column);
画外音,请避坑:
使用count(distinct column1, column2)时,如果一列全为NULL,另一列即使有不同值,也会返回0;
SQL强制规范三:NULL规范
1. 如果一列全是NULL,sum(column)返回的是NULL,因此在使用sum时,应用程序务必考虑NPE问题;
画外音:NPE,NullPointerException
SQL强制规范四:NULL规范
1. 使用ISNULL(column)判断列是否为空,不要使用column is null 或者column is not null;
画外音:
1. NULL与任何值比较都是NULL;
2. column is (not) null可能导致换行,影响可读性,而ISNULL(column)是一个整体;
3. ISNULL(column)的执行效率更高;
SQL强制规范五:分页规范
1. 应用层分页查询逻辑,必须加上count为0时直接返回的判断;
画外音:
1. 避免执行分页语句提高性能;
SQL强制规范六:外键规范
1. 禁止使用外键;
2. 外键约束问题必须在应用层解决;
3. 禁止使用级联查询;
画外音:
1. 针对于互联网大数据量高并发量的数据存储场景来说,外键与级联查询对性能的潜在影响较大;
2. 外键与级联查询存在更新风暴的风险;
级联查询是指,一个查询的结果依赖于另一个查询的结果,通常是通过子查询或者嵌套查询实现的。
更新风暴问题是指,由于某些约束,例如外键约束或者触发器约束,当一条记录被更新时,相关约束的记录也会被更新,引发一系列连锁反应,导致短时间大量更新操作引发数据库性能下降甚至死锁的问题。因此,分布式场景一般禁止使用外键约束,或者触发器约束。
SQL强制规范七:存储过程规范
1. 禁止使用存储过程;
画外音:
1. 但针对于互联网大数据量高并发量的数据存储场景来说,存储过程对性能的潜在影响较大;
2. 难以调试;
3. 无可移植性;
SQL强制规范八:别名规范
1. SQL中对于列的查询与修改,如果涉及多个表,必须使用表名(或者别名)对列进行限定;
画外音:
1. 如果不进行限定,未来对表DDL时,不同表可能出现同名列,使得原本正常的程序在DDL后突然异常;
SQL强制规范九:线上操作规范
1. 线上数据库进行update/delete操作时,必须先同查询条件select执行,确认结果后再update/delete;
画外音:
1. 懂的都懂;
好了,阿里MySQL强制规范的下半部分就写完了。大伙可能觉得规范简单,但实际上,规范背后的原理比规范本身,更有价值。
作业:
上面13条强制规范,有没有你不同意?