引言
你真的了解数据库的索引吗?
分享几个数据库索引的面试题吧(个人觉得大都可以算有坑的)。
1、索引的底层的数据结构是什么?(确定是B+树吗)
2、为什么采用B+树而不用B树?
3、A、B、C三列建立索引,where A > 100 and B > 100能用上索引吗?
4、InnoDB的索引和MyISAM的索引区别是啥呢?
索引的作用
索引的作用是什么可能大家都十分清楚,之前得到项目中,一组sql的执行时间高达10s,后来处理了半天,发现改了一下索引就在1s之内解决了。所以,索引对于我们的sql效率有着巨大的影响。
索引的数据结构
其实这个问题,我在之前一直认为索引是B+树,以至于Navicat中简历索引的时候提示什么类型,我还心存疑问。但是事实上索引的数据结构和我们的引擎也是有着巨大的关系的。例如在InnoDB和MyISAM引擎中,索引都默认是B+树,但是在Memory引擎中,索引就可以设置为Hash表,Hash表这种数据结构的特点就是快。但是缺点就是无法进行范围操作和会产生Hash冲突。
B+树索引
利用B+树的索引,缺点就是查找的效率没有hash快,但是优点是对范围操作同样适应。之所以不用B树,这个和B树以及B+树的数据结构有关系了。B+树的数据都在叶子节点中,而B树的数据在各个节点之中。这样B+树和B树相比较就能提高IO性能。而同样是B+树,MyISAM和InnoDB有什么区别呢?答案就是MyISAM的叶子节点并不存储数据,而是存放指向当前数据所在行的指针。但是InnoDB的数据就直接存在叶子节点之中。
Hash索引
Memory的Hash索引,同样具有Hash索引的缺点,Memory用来解决Hash冲突的方式是采用的链地址法,这样的话就会有缺点,当Hash冲突过多的时候,并不会提升Hash查找的效率。
Hash冲突的四种解决方法:
- 链地址法
- 开放定址法
- 再Hash法
- 建立公共溢出区法
用到索引了吗
回到第三个问题,用到索引了吗,答案自然就分类讨论了
在B+树索引中
自然是用到了,但是只用到了A,因为对于范围查找第二个部分是会失效的,同时对于AB,AC,BC这样的联合查找来说,AB AC能用到索引(最左匹配原则),BC用不到,但是AC只能用到A用不到C。
在Hash索引中
Hash索引比较特殊,不能对范围操作,因此用不到索引。同时Hash索引还有个很大的特点,可以用IN() ,B+tree索引却不能这样。那么将>改成=号是否就可以了呢。答案是否定的。因为,若是在ABC建立索引,那么只有当同时用到ABC的时候才能用到索引。
以上均来自《高性能Mysql》