介绍
索引是通过某种算法,构建出一种模型,用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL就能快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
索引的分类
索引是存储引擎用来快速查找记录的一种数据结构
实现方式来分
Hash索引
Hash索引会将索引字段里的值根据某种方式(函数)进行计算,算出一个值,这样在查找数据时就可以由算出的值来找到其对应的数据
哈希冲突:不同的值通过相同函数得到的值可能相同,这就是哈希冲突。哈希冲突即使发生,查找值时发现不同会跳过,去找冲突的其他值,因此仍然可以找到数据,且速度比全表查询要快
B+Tree索引
B+Tree索引也会根据索引字段来得到一个值,并由树状结构来存储这些值
功能来分
查看索引
单列索引
单列索引:一个索引只包含单个列,但一个表中可以有多个单列索引
普通索引
普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值
创建索引
方式一:创建表的时候直接指定
格式:index 索引名(字段名)
方式二:直接创建
格式:create index 索引名 on 表名(字段名);
方式三:修改表结构
格式:alter table 表名 add index 索引名(字段名);
删除索引
唯一索引
唯一索引:唯一索引中索引列的值必须唯一,但可以为空。如果是组合索引,则列值的组合必须唯一
创建索引
方式一:创建表的时候直接指定
格式:unique 索引名(字段名)
方式二:直接创建
格式:create unique index 索引名 on 表名(字段名);
方式三:修改表结构
格式:alter table 表名 add unique 索引名(字段名);
删除索引
与删除普通索引的方式相同
主键索引
主键索引:当我们在创建表时,如果该表有主键,则MySQL会自动在主键列上建立一个索引,这就是主键索引。主键索引具有唯一性且不为NULL
组合索引
组合索引:组合索引也叫复合索引,指的是我们在建立索引的时候使用多个字段。可以建立普通索引或者是唯一索引。
复合索引的使用符合最左原则
创建索引
create index 索引名 on 表名(字段1,字段2...)
在index前面加上unique即可创建唯一索引
最左原则
全文索引(了解)
概述
MySQL中的全文索引,有两个变量,最小搜索长度和最大搜索长度。想对一个词语使用全文索引搜索时,这个词语长度必须在这两个变量的区间内。
可以用以下命令查看这两个的默认值:
创建全文索引
方式一:创建表的时候添加全文索引
fulltext (字段名)
方式二:直接创建
格式:create fulltext index 索引名 on 表名(字段名);
方式三:修改表结构
格式:alter table 表名 add fulltext 索引名(字段名);
使用索引
使用全文索引和常用的模糊匹配使用like + %不同,全文索引有自己的语法格式,使用match和againt关键字
格式:
match(字段名) against (搜索的关键词)
例
注:
1.使用全文索引时需要用在where语句后
2.使用全文索引能够搜索出包含关键词的行数据
空间索引(了解)
概述
空间类型
创建索引
空间索引在创建表时创建
格式:spatial key 索引名(字段名)
注:创建的字段必须是空间类型的字段
例
索引的原理
概述
相关算法
Hash算法
Hash:即哈希值,根据某种函数将值进行计算,得到一个值,这个值就是地址,查找数据就可以通过计算来得到一个哈希值并匹配,找到数据所在
优点:通过字段的值计算的hash值,定位数据非常快
缺点:不能进行范围查找,因为散列表中的值时无序的,无法进行大小的比较
二叉树
特性:分为左子树、右子树和根节点,左子树比根节点值要小,右子树比根节点要大,找的时候会
缺点:有可能产生不平衡,类似于链表的结构(右图);且也不能查找范围
平衡二叉树
特点:
1.它的左子树和右子树都是平衡二叉树
2.左子树比根中间值要小,右子树比中间值要大
3.左子树和右子树的深度之差的绝对值不超过1
缺点:
1.插入操作需要旋转
2.支持范围查询,但回旋查询效率较低,必须要查找大于8的,会回旋到父节点7、10
3.如果存放几百条数据的情况下,树高度越高,查询效率会越慢
BTREE树(重点)
目前大部分数据库及文件系统都采用B-Tree或其变种B+Tree作为索引结构,Btree结构可以有效的解决之前的相关算法遇到的问题
MySQL使用的是B+Tree
B-Trees:B-Trees有一个Max.Degree,是表示树是几阶的,即每个节点储存的数不能超过几个
每次添加数据时,会根据数据大小得到一个编号,并根据编号依次存放到树中,当一个节点的数据达到Max.Drgree时,会自动分裂,处于中间的数据会向上分裂,且左右各有一个指针,分别指向比其小的节点和比其大的节点,如果节点里有两个数,则有三个指针,依次类推。分裂后,再加入数据依然会在最后面加入数据,如上图会在7号数据所在节点添加数据
B+Trees:与B-Trees基本相同,但B+Tress在分裂后在最底层的节点(叶节点)仍会保留该数据,且叶节点中的节点与相邻的叶节点中的节点有一个双向指针,可以相互找到,因此在查找范围时,如大于2的数,可以先找到2,再通过指针依次找到大于2的所有数
MyISAM引擎使用B+Tree
MyISAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址
InnoDB引擎使用B+Tree
InnoDB的叶节点的data域存放的是数据,相比MyISAM效率要高一些,但是比较占硬盘内存的大小