Mysql底层的索引数据结构用到了那些?
B+TREE,Hash表
为什么选择B+TREE而不选择BTREE?
如上图所示,这是一个B树的数据结构和B+树的数据结构。
- b树在存储的过程中,他的非叶子节点会将索引与数据一起存储,会导致非叶子结点不能存储过多的索引,从而加深树的高度,而B+树的非叶子结点只会存储索引不会存储数据的数据,可以容纳更多的索引,从而减小树的高度,从而减小遍历的次数。
- B+树叶子结点存在指针,指向下一个叶子结点的地址,可以高效的获取数据。
Hash索引
Hash是以数组和链表的形式进行数据的存储,先计算其hashcode的值,将相同数据以链表的形式进行存储。
如果链表上的数据较少的话,Hash索引的效率其实是大于B+树的
如果使用Hash索引的话,可能会导致hash冲突(虽然mysql做了很多底层的优化)。
仅使用于=,in的情况,不适用于范围查询,如果进行范围查询,不能快速定位到太多元素。
Mysql的数据库数据引擎有那些?
常用的Mysql数据引擎SAM、MYISAM、HEAP、INNODB和BERKLEY
MYISAM和INNODB数据引擎的区别?
1.INNODB是聚簇索引(数据和索引存储在一起),存储文件为两个文件,一个是.frm文件(存储表的结构)第二个是.ibd文件(存储表的索引+数据);而MYISAM是非聚簇索引(数据和索引不存储在一起)存储文件为三个文件,第一个是.frm文件(存储表结构),第二个MYD(存储数据),第三个MYI(存储索引)。所以用MYISAM进行数据存储会造成多IO的读取,效率较慢。
- InnoDB支持事务,MyISAM不支持,对于InnoDB每一条SQL语言都默认封装成事务,自动提交,这样会影响速度,所以最好把多条SQL语言放在begin和commit之间,组成一个事务;
3.InnoDB表必须有唯一索引(建议为整型自增字段,如主键,如果用户没有指定的话会自己找/生产一个隐藏列Row_id来充当默认主键),而Myisam可以没有。
4.InnoDB支持外键,而MyISAM不支持。对一个包含外键的InnoDB表转为MYISAM会失败;
联合索引的数据结构
联合索引会先去比较第一个字段,进行排序,如果第一个字段相同在比较第二个字段在根据第二个字段进行排序。