Mysql学习记录（包含设计，使用，优化）

最新推荐文章于 2023-11-25 20:53:46 发布

华珺0629

最新推荐文章于 2023-11-25 20:53:46 发布

阅读量78

点赞数

分类专栏： Mysql java历程文章标签： mysql

本文链接：https://blog.csdn.net/qq_43081517/article/details/112192082

版权

java历程同时被 2 个专栏收录

30 篇文章 0 订阅

订阅专栏

Mysql

1 篇文章 0 订阅

订阅专栏

架构分层

mysql是插件式的,可拔插的数据库,可根据业务需求和实际需要修改插件或者引擎

连接层 : JDBC,.NET,PHP等
连接池 : c3p0,德鲁伊等
管理工具层 : 备份,容灾恢复,安全,复制,集群等
sql接口 : 存储过程,视图触发器等
解析层 : 查询事务,对象(语句)权限等,将语句重组解析
优化层 : 对用户写的sql进行优化;极端情况下,不一定符合用户的需求
缓存/缓冲区 : 最大连接池,buf缓冲池大小等,可以在my.cnf修改
引擎层 : MyISAM,InnoDB 等10+种,一般只用前两种,暂时默认是InnoDB,区别可查看图片
文件/日志系统

SQL调优

性能下降,执行时间长,等待时间长语句写的差/索引失效/关联查询太多(设计缺陷|不得已需求)等
建立单值索引：user表的name字段 CREATE index idx_user_name on user(name);
建立多值索引：CREATE index idx_user_nameEmail on user(name,email);
索引,是帮助MYSQL 高效获取数据的数据结构简单理解:排好序的快速查找的数据结构索引影响 where 和 order by的速度

性能分析

MySql Query Optimizer mysql自带的性能查询优化器
Explain + 可运行的 sql语句

Explain

id 表示加载顺序,大的是先加载的

select_type 常用有6种:

	SIMPLE		简单查询,查询中不包含子查询 或 UNINO
	PRIMARY		若子查询中包含任何复杂的子部分,最外层则被标记为PRIMARY	,一般是表示最后被记载的
	SUBQUERY	子查询
	DERIVED		虚拟表/衍生表,包含子查询时
	UNION		若第二个SELECT包含UNION时
	UNION RESULT	从UNION	表中获取结果的SELECT

TABLE

type 字面表示访问类型

     有8种值,从最好到最差一次是 system>const>eq_ref>ref>range>index>ALL
	 system 指调用只有一条的数据,没有意义
	 const  指根据主键唯一索引(key)  查找一条数据,通过测试,即使数据500W,查询也仅需0.03秒 
	 eq_ref 指创建了索引,且当前索引唯一
	 ref    指创建了索引,但是有可能包含多条数据
	 range  指范围 between < > in等
	 index  指只遍历索引树
	 ALL    全表扫描

possible_keys 查询可能用到的索引,但是不一定会被用到
key_len 表示查询时，用到的字节数，越小越好；（查询时条件越少越小）
ref 表示本次查询引用到的数据
rows 表示本次查询，可能会需要查询的行数；如果复合查询，且有复合索引，会降低这个值
Extra 一些很重要，但是不适合在其他列显示的信息

 	Using filesort	mysql会使用外部的索引排序，而不是按照表内索引顺序；
 			当我们建立一个复合索引，但是查询时，没有按照复合索引的顺序；
 			无法利用索引完成的排序 被称作“文件排序”；
 	Using temporary	order by，group by后的字段 和 复合索引顺序不一致，会产生临时表，文件排序
 	Using index	表示没有访问 表，效率很好，如果同时出现了Using where，表示索引被用到
 	Using where	表示使用了过滤
 	Using join buff	使用了连接缓冲，如果经常用到，可以调大 配置文件中的这个值
 	impossible	where子句的值是false，不能获取任何元组；比如where id=1 and id = 2；
 	......		其他的不重要，不做介绍

分析1：

查询xx_tab，a字段为1，b字段>1,且c字段最大的一条信息时：如果我们创建 abc索引，会导致范围扫描，第二个索引失效；
这时我们可以只创建ab索引即可；
分析2：
左连接（1.1.0），表示坐标全有，所以右表必须加索引，相反，右连接左表必须加索引
join：
永远都是小表驱动大表；小的结果集，驱动大的结果集；保证join字段被索引；内存允许的情况下，增加配置中JoinBuff的值；

复合索引规则：
1：全值匹配最佳
2：左前缀法则：查询时，必须从索引的第一个值开始，否则索引失效；如果中间不匹配，降低索引效率
3：不在索引列做任何操作（计算，函数，类型转换），否则会导致索引失效
4：范围判断之后，右列全失效；例：abc索引，where a=‘1’ and b like ‘x%’ and c = ‘2’ 只有ab的索引被用到，c失效
5：尽量查询的值覆盖索引；即便有范围查询，也可以避免读表
6：!= 或 <> 会导致索引失效，而扫描全表；
7：is null，is not null，也会导致索引失效；
8：当like 以 %开头时，会导致索引失效；如果业务需要必须这么写，需要select 后面的字段覆盖索引；感觉不合理，为什么不先在索引查出数据，再去查表呢
9：char类型必须带引号，比如name为‘10’；当以name=10查询时，会导致失效；感觉不合理
10：or 也会导致索引失效；感觉不合理。

优化总结：
1：观察，跑一天，看看生产慢的sql的情况
2：开始慢查询，设值阈值，比如5s，抓取；
3：使用Explain +慢sql分析解决80%问题
4：show profile 解决98%问题
5：参数调优如果还解决不了，分表分库
小表驱动大表：
A表部门表，B表员工表
select * from A where id IN(select id from B); 当B表数据小于A表数据时，in 优于exists;
select * from A where exists (select 1 from b where B.id = A.id) 当A表数据小于B表数据时，exists优于in

优化原则

1.数据库设计和表创建时就要考虑性能
2.sql的编写需要注意优化
4.分区
4.分表
5.分库

mysql设计表：

表字段避免null值出现，null值很难查询优化且占用额外的索引空间，推荐默认数字0代替null。
尽量使用INT而非BIGINT，如果非负则加上UNSIGNED（这样数值容量会扩大一倍），当然能使用TINYINT、SMALLINT、MEDIUM_INT更好。
使用枚举或整数代替字符串类型尽量使用TIMESTAMP而非DATETIME 单表不要有太多字段，建议在20以内
用整型来存IP

索引

索引并不是越多越好，要根据查询有针对性的创建，考虑在WHERE和ORDER
BY命令上涉及的列建立索引，可根据EXPLAIN来查看是否用了索引还是全表扫描
应尽量避免在WHERE子句中对字段进行NULL值判断，否则将导致引擎放弃使用索引而进行全表扫描
值分布很稀少的字段不适合建索引，例如"性别"这种只有两三个值的字段
字符字段只建前缀索引
字符字段最好不要做主键
不用外键，由程序保证约束
尽量不用UNIQUE，由程序保证约束
使用多列索引时主意顺序和查询条件保持一致，同时删除不必要的单列索引

选择合适的索引

选择合适的数据类型

（1）使用可存下数据的最小的数据类型，整型 < date,time < char,varchar < blob
（2）使用简单的数据类型，整型比字符处理开销更小，因为字符串的比较更复杂。如，int类型存储时间类型，bigint类型转ip函数
（3）使用合理的字段属性长度，固定长度的表会更快。使用enum、char而不是varchar
（4）尽可能使用not null定义字段
（5）尽量少用text，非用不可最好分表

选择合适的索引列

（1）查询频繁的列，在where，group by，order by，on从句中出现的列
（2）where条件中<，<=，=，>，>=，between，in，以及like 字符串+通配符（%）出现的列
（3）长度小的列，索引字段越小越好，因为数据库的存储单位是页，一页中能存下的数据越多越好
（4）离散度大（不同的值多）的列，放在联合索引前面。查看离散度，通过统计不同的列值来实现，count越大，离散程度越高：

sql的编写需要注意优化

使用limit对查询结果的记录进行限定
避免select *，将需要查找的字段列出来
使用连接（join）来代替子查询
拆分大的delete或insert语句
可通过开启慢查询日志来找出较慢的SQL
不做列运算：SELECT id WHERE age + 1 =
10，任何对列的操作都将导致表扫描，它包括数据库教程函数、计算表达式等等，查询时要尽可能将操作移至等号右边
sql语句尽可能简单：一条sql只能在一个cpu运算；大语句拆小语句，减少锁时间；一条大sql可以堵死整个库
OR改写成IN：OR的效率是n级别，IN的效率是log(n)级别，in的个数建议控制在200以内
不用函数和触发器，在应用程序实现
避免%xxx式查询
少用JOIN
使用同类型进行比较，比如用’123’和’123’比，123和123比
尽量避免在WHERE子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描
对于连续数值，使用BETWEEN不用IN：SELECT id FROM t WHERE num BETWEEN 1 AND 5
列表数据不要拿全表，要使用LIMIT来分页，每页数量也不要太大

华珺0629

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mysql学习记录（包含设计，使用，优化）

架构分层mysql是插件式的,可拔插的数据库,可根据业务需求和实际需要修改插件或者引擎连接层 : JDBC,.NET,PHP等连接池 : c3p0,德鲁伊等管理工具层 : 备份,容灾恢复,安全,复制,集群等sql接口 : 存储过程,视图触发器等解析层 : 查询事务,对象(语句)权限等,将语句重组解析优化层 : 对用户写的sql进行优化;极端情况下,不一定符合用户的需求缓存/缓冲区 : 最大连接池,buf缓冲池大小等,可以在my.cnf修改引擎层 : MyISAM,Inno
复制链接

扫一扫