前言
最近工作中接触了一个非常 垃圾 牛x哄哄的项目,加载一个逻辑并不复杂的首页居然要16s左右,作为一个眼里能容下一座山的我,怎能坐视不管,于是就来优化一波,第一步肯定是要看看数据量和索引情况,不看不知道,一看吓一跳,几百万数据的MySQL表居然仅仅用了默认的自增主键索引,傲娇的我仿佛看到了性能提升后升职加薪的场景,于是乎先来搞一波SQL优化,在此之前先来复习一下MySQL的索引吧。
索引数据结构
我们都知道,MySQL中如果不使用索引时,我们查询数据会进行全表扫描,数据量比较大的情况下,扫描全部数据必然导致查询效率变低,于是我们就会给表加上索引来提高查询效率。首先索引的数据结构有二叉树、红黑树、Hash表、B树和B+树,我们知道MySQL索引结构是B+树,那就来看看为什么要使用B+树以及为什么不使用其他的数据结构
- 二叉树:二叉树的结构是左节点 > 有节点,至于MySQL为什么不使用二叉树作为索引的数据结构呢,因为,如果我们插入的数据是有序的(假如是递增),这样的二叉树就会形成一棵右子树,导致我们查询数据和全表扫描几乎没有区别,所以放弃使用二叉树;
- 红黑树:红黑树也可以称作平衡二叉树,在二叉树的基础上做了平衡的操作,以此避免只有左子树或者右子树的情况,但MySQL也没有选择红黑树作为索引的数据结构,这是因为随着表数据量的增多,红黑树的高度会变得越来越高,从根节点开始查询数据的次数也会变得越来越多