MYSQL 优化与编写注意事项很全

最新推荐文章于 2022-05-18 09:10:38 发布

会飞的大灰狼

最新推荐文章于 2022-05-18 09:10:38 发布

阅读量168

点赞数

分类专栏： mysql 文章标签： mysql 数据库 sql

本文链接：https://blog.csdn.net/qq_39884965/article/details/120782755

版权

mysql 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

MYSQL 优化与编写注意事项很全

SQL编写规范
DML（Data Manipulation Language）
它们是SELECT、UPDATE、INSERT、DELETE，就象它的名字一样，这4条命令是用来对数据库里的数据进行操作的语言

DDL（Data Definition Language）
DDL比DML要多，主要的命令有CREATE、ALTER、DROP等，DDL主要是用在定义或改变表（TABLE）的结构，数据类型，表之间的链接和约束等初始化工作上，他们大多在建立表时使用

DCL（Data Control Language）
是数据库控制功能。是用来设置或更改数据库用户或角色权限的语句，包括（grant,deny,revoke等）语句。在默认状态下，只有sysadmin,dbcreator,db_owner或db_securityadmin等人员才有权力执行DCL

命名规范
库名、表名、字段名必须使用小写字母，并采用下划线分割，如：sign_type

MySQL有配置参数lower_case_table_names，不可动态更改，linux系统默认为 0，即库表名以实际情况存储，大小写敏感。如果是1，以小写存储，大小写不敏感。如果是2，以实际情况存储，但以小写比较。
如果大小写混合使用，可能存在abc，Abc，ABC等多个表共存，容易导致混乱。
字段名显示区分大小写，但实际使⽤用不区分，即不可以建立两个名字一样但大小写不一样的字段。
为了统一规范，库名、表名、字段名使用小写字母。
库名、表名、字段名禁止超过32个字符

库名、表名、字段名支持最多64个字符，但为了统一规范、易于辨识以及减少传输量，禁止超过32个字符
使用INNODB存储引擎

INNODB引擎是MySQL5.5版本以后的默认引擘，支持事务、行级锁，有更好的数据恢复能力、更好的并发性能，同时对多核、大内存、SSD等硬件支持更好，支持数据热备份等，因此INNODB相比MyISAM有明显优势。
库名、表名、字段名禁止使用MySQL保留字

当库名、表名、字段名等属性含有保留字时，SQL语句必须用反引号引用属性名称，这将使得SQL语句书写、SHELL脚本中变量的转义等变得⾮非常复杂。
禁止使用分区表

分区表对分区键有严格要求；分区表在表变大后，执⾏行DDL、SHARDING、单表恢复等都变得更加困难。因此禁止使用分区表，并建议业务端手动SHARDING。sharding-jdbc
建议使用UNSIGNED存储非负数值

同样的字节数，非负存储的数值范围更大。如TINYINT有符号为 -128-127，无符号为0-255
建议使用INT UNSIGNED存储IPV4

用UNSINGED INT存储IP地址占用4字节，CHAR(15)则占用15字节。另外，计算机处理整数类型比字符串类型快。使用INT UNSIGNED而不是CHAR(15)来存储IPV4地址，通过MySQL函数inet_ntoa和inet_aton来进行转化。IPv6地址目前没有转化函数，需要使用DECIMAL或两个BIGINT来存储。

1
2
SELECT INET_ATON(‘209.207.224.40’); 3520061480
SELECT INET_NTOA(3520061480); 209.207.224.40
强烈建议使用TINYINT来代替ENUM类型

ENUM类型在需要修改或增加枚举值时，需要在线DDL，成本较高；ENUM列值如果含有数字类型，可能会引起默认值混淆。
使用VARBINARY存储大小写敏感的变长字符串或二进制内容

VARBINARY默认区分大小写，没有字符集概念，速度快
INT类型固定占用4字节存储

例如INT(4)仅代表显示字符宽度为4位，不代表存储长度。数值类型括号后面的数字只是表示宽度而跟存储范围没有关系，比如INT(3)默认显示3位，空格补齐，超出时正常显示，python、java客户端等不具备这个功能。
区分使用DATETIME和TIMESTAMP MySQL 中你应该使用什么数据类型表示时间？

存储年使用 YEAR 类型。
存储日期使用 DATE 类型。
存储时间(精确到秒)建议使用 TIMESTAMP 类型。
DATETIME和TIMESTAMP都是精确到秒，优先选择 TIMESTAMP，因为TIMESTAMP只有4个字节，而 DATETIME 8个字节。同时TIMESTAMP具有自动赋值以及自动更新的特性。注意：在5.5和之前的版本中，如果一个表中有多个timestamp列，那么最多只能有一列能具有自动更新功能。

如何使用TIMESTAMP的自动赋值属性?
a)自动初始化，而且自动更新：
column1 TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP

b)只是自动初始化：
column1 TIMESTAMP DEFAULT CURRENT_TIMESTAMP

c)自动更新，初始化的值为0：
column1 TIMESTAMP DEFAULT 0 ON UPDATE CURRENT_TIMESTAMP

d)初始化的值为0：
column1 TIMESTAMP DEFAULT 0

所有字段均定义为NOT NULL

对表的每一行，每个为NULL的列都需要额外的空间来标识。
B树索引时不会存储NULL值，所以如果索引字段可以为NULL，索引效率会下降。
建议用0、特殊值或空串代替NULL值
字段涉及到金额的，数据库中用单位：分存储，字段类型：bigInt，对应java类型为：Long

MySQL使用技巧
当只需要一条数据的时候，使用limit 1

1
SELECT email，uid FROM user_email WHERE uid=123 limit 1;
不建议使用%前缀模糊查询

例如 LIKE “%name” 或者 LIKE “%name%” ，这种查询会导致索引失效而进行全表扫描。
可以使用 LIKE “name%”
使用合理的分页方式以提高分页的效率

1
select id,name from product limit 866613, 20
使用上述sql语句做分页的时候，可能有人会发现，随着表数据量的增加，直接使用limit分页查询会越来越慢。优化的方法如下：可以取前一页的最大行数的id，然后根据这个最大的id来限制下一页的起点。比如此列中，上一页最大的id是866612。sql可以采用如下的写法：

1
select id,name from product where id> 866612 limit 20
将大字段、访问频率低的字段拆分到单独的表中存储，分离冷热数据

有利于有效利用缓存，防⽌读入无用的冷数据，较少磁盘IO，同时保证热数据常驻内存提⾼高缓存命中率。
禁止在数据库中存储明文密码

采用加密字符串存储密码，并保证密码不可解密，同时采用随机字符串加盐保证密码安全。
表必须有主键，推荐使用UNSIGNED自增列作为主键

表没有主键，INNODB会默认设置隐藏的主键列；
没有主键的表在定位数据行的时候非常困难，也会降低基于行复制的效率。
应该为数据库里的每张表都设置一个ID作为其主键，而最好的是一个INT型（推荐使用UNSIGNED），并设置上自动增长的AUTO INCREMENT标志。
禁止冗余索引

索引是双刃剑，会增加维护负担，增大IO压力。(a,b,c)、(a,b)，后者为冗余索引。可以利用前缀索引来达到加速目的，减轻维护负担。
禁止重复索引

primary key a;uniq index a;重复索引增加维护负担、占用磁盘空间，同时没有任何益处。
不在低基数列上建立索引，例如“性别”

大部分场景下，低基数列上建立索引的精确查找，相对于不建立索引的全表扫描没有任何优势，而且增大了IO负担。
合理使用覆盖索引减少IO，避免排序。

覆盖索引能从索引中获取需要的所有字段，从⽽而避免回表进行二次查找，节省IO。
INNODB存储引擎中，secondary index(非主键索引，又称为辅助索引、二级索引)没有直接存储行地址，而是存储主键值。
如果用户需要查询secondary index中所不包含的数据列，则需要先通过secondary index查找到主键值，然后再通过主键查询到其他数据列，因此需要查询两次。覆盖索引则可以在⼀一个索引中获取所有需要的数据，因此效率较高。
例如 SELECT email，uid FROM user_email WHERE uid=xx ，如果uid不是主键，适当时候可以将索引添加为index(uid，email)，以获得性能提升。
用IN代替OR。SQL语句中IN包含的值不应过多，应少于1000个。

IN是范围查找，MySQL内部会对IN的列表值进行排序后查找，比OR效率更高。
表字符集使用UTF8，必要时可申请使用UTF8MB4字符集。

UTF8字符集存储汉字占用3个字节，存储英文字符占用一个字节。
UTF8统一而且通用，不会出现转码出现乱码风险。
如果遇到EMOJ等表情符号的存储需求，可申请使用UTF8MB4字符集。
用UNION ALL代替UNION。

UNION ALL不需要对结果集再进行排序
UNION 和 UNION ALL 的差异主要是前者需要将结果集合并后再进行唯一性过滤操作，这就会涉及到排序，增加大量的CPU运算，加大资源消耗及延迟。当然，UNION ALL 的前提条件是两个结果集没有重复数据。
禁止使用order by rand()。

order by rand()会为表增加一个伪列，然后用rand()函数为每一行数据计算出rand()值，然后基于该行排序，这通常都会生成磁盘上的临时表，因此效率非常低。建议先使用rand()函数获得随机的主键值，然后通过主键获取数据。
SELECT 只获取必要的字段，禁⽌使用 SELECT *

减少网络带宽消耗；
能有效利用覆盖索引；
表结构变更对程序基本无影响
SQL中避免出现now()、rand()、sysdate()、current_user()等不确定结果的函数。

语句级复制场景下，引起主从数据不一致；不确定值的函数，产⽣的SQL语句无法利用QUERY CACHE。
采用合适的分库分表策略

采用合适的分库分表策略，有利于业务发展后期快速对数据库进行水平拆分，同时分库可以有效利⽤用MySQL的多线程复制特性。
减少与数据库交互次数，尽量采用批量SQL语句。

使用下面的语句来减少和db的交互次数:

1
2
3
4
a)INSERT … ON DUPLICATE KEY UPDATE
b)REPLACE INTO
c)INSERT IGNORE
d)INSERT INTO VALUES()
拆分复杂SQL为多个小SQL，避免大事务。

简单的SQL容易使⽤用到MySQL的QUERY CACHE；
减少锁表时间特别是MyISAM；
可以使用多核 CPU。
对同一个表的多次alter操作必须合并为一次操作。

mysql对表的修改绝大部分操作都需要锁表并重建表，而锁表则会对线上业务造成影响。为减少这种影响，必须把对表的多次alter操作合并为一次操作。例如，要给表t增加一个字段b，同时给已有的字段aa建立索引，通常的做法分为两步：

1
2
3
4
5
alter table t add column b varchar(10);

然后增加索引：

alter table t add index idx_aa(aa);

正确的做法是：

alter table t add column b varchar(10),add index idx_aa(aa);
避免使用存储过程、触发器、视图、自定义函数等。

这些高级特性有性能问题，以及未知BUG较多。业务逻辑放到数据库会造成数据库的DDL、SCALE OUT、
SHARDING等变得更加困难。
禁止有super权限的应用程序账号存在。

安全第一。super权限会导致read only失效，导致较多诡异问题而且很难追踪。
不要在MySQL数据库中存放业务逻辑。

数据库是有状态的服务，变更复杂而且速度慢，如果把业务逻辑放到数据库中，将会限制业务的快速发展。建议把业务逻辑提前，放到前端或中间逻辑层，而把数据库作为存储层，实现逻辑与存储的分离。
SQL语句是有长度限制，在进行数据合并在同一SQL中务必不能超过SQL长度限制

通过 max_allowed_packet 配置可以修改，默认是1M，测试时修改为8M
1
INSERT INTO insert_table (datetime,uid,content,type) VALUES (‘0’,‘userid_0’,‘content_0’,0),(‘1’,‘userid_1’,‘content_1’,1);
事务需要控制大小，事务太大可能会影响执行的效率

MySQL有 innodb_log_buffer_size 配置项，超过这个值会把innodb的数据刷到磁盘中，这时，效率会有所下降。所以比较好的做法是，在数据达到这个这个值前进行事务提交。

会飞的大灰狼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MYSQL 优化与编写注意事项很全

MYSQL 优化与编写注意事项很全SQL编写规范DML（Data Manipulation Language）它们是SELECT、UPDATE、INSERT、DELETE，就象它的名字一样，这4条命令是用来对数据库里的数据进行操作的语言DDL（Data Definition Language）DDL比DML要多，主要的命令有CREATE、ALTER、DROP等，DDL主要是用在定义或改变表（TABLE）的结构，数据类型，表之间的链接和约束等初始化工作上，他们大多在建立表时使用DCL（Data C
复制链接

扫一扫