除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑、部署、运维的各种复杂度,一般以整型值为主的表在千万级以下,字符串为主的表在五百万以下是没有太大问题的。
b:VARCHAR的长度只分配真正需要的空间
c:使用枚举或整数代替字符串类型
d:尽量使用TIMESTAMP而非DATETIME,
e:单表不要有太多字段,建议在20以内
f:避免使用NULL字段,很难查询优化且占用额外索引空间
g:用整型来存IP
b:应尽量避免在WHERE子句中对字段进行NULL值判断,否则将导致引擎放弃使用索引而进行全表扫描
c:值分布很稀少的字段不适合建索引,例如"性别"这种只有两三个值的字段
d:字符字段只建前缀索引
e:字符字段最好不要做主键
f:不用外键,由程序保证约束
g:尽量不用UNIQUE,由程序保证约束
h:使用多列索引时主意顺序和查询条件保持一致,同时删除不必要的单列索引
b:不做列运算:SELECT id WHERE age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边
c:sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库
d:不用SELECT *
e:OR改写成IN:OR的效率是n级别,IN的效率是log(n)级别,in的个数建议控制在200以内
f:不用函数和触发器,在应用程序实现
g:避免%xxx式查询,查询SQL
h:少用JOIN
I:使用同类型进行比较,比如用'123'和'123'比,123和123比
j:尽量避免在WHERE子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描
k:对于连续数值,使用BETWEEN不用IN:SELECT id FROM t WHERE num BETWEEN 1 AND 5
1:字段
a:尽量使用TINYINT、SMALLINT、MEDIUM_INT作为整数类型而非INT,如果非负则加上UNSIGNEDb:VARCHAR的长度只分配真正需要的空间
c:使用枚举或整数代替字符串类型
d:尽量使用TIMESTAMP而非DATETIME,
e:单表不要有太多字段,建议在20以内
f:避免使用NULL字段,很难查询优化且占用额外索引空间
g:用整型来存IP
2:索引
a:索引并不是越多越好,要根据查询有针对性的创建,考虑在WHERE和ORDER BY命令上涉及的列建立索引,可根据EXPLAIN来查看是否用了索引还是全表扫描b:应尽量避免在WHERE子句中对字段进行NULL值判断,否则将导致引擎放弃使用索引而进行全表扫描
c:值分布很稀少的字段不适合建索引,例如"性别"这种只有两三个值的字段
d:字符字段只建前缀索引
e:字符字段最好不要做主键
f:不用外键,由程序保证约束
g:尽量不用UNIQUE,由程序保证约束
h:使用多列索引时主意顺序和查询条件保持一致,同时删除不必要的单列索引
3:查询SQL
a:可通过开启慢查询日志来找出较慢的SQLb:不做列运算:SELECT id WHERE age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边
c:sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库
d:不用SELECT *
e:OR改写成IN:OR的效率是n级别,IN的效率是log(n)级别,in的个数建议控制在200以内
f:不用函数和触发器,在应用程序实现
g:避免%xxx式查询,查询SQL
h:少用JOIN
I:使用同类型进行比较,比如用'123'和'123'比,123和123比
j:尽量避免在WHERE子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描
k:对于连续数值,使用BETWEEN不用IN:SELECT id FROM t WHERE num BETWEEN 1 AND 5
l:列表数据不要拿全表,要使用LIMIT来分页,每页数量也不要太大