索引
1、什么是索引?
索引是数据库表的字段上添加的,是为了提高查询效率存在的一种机制。
一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。
索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
如:
select * from user where name = 'Jack';
以上的这条SQL语句会去name字段上扫描,为什么?
因为查询条件是:name = ‘Jack’
如果name字段上没有添加索引(目录),或者说没有给name字段创建索引,MySQL会进行全扫描,会将name字段上的每一个值都比对一遍,效率比较低。
MySQL在查询方面主要就是两种方式:
第一种方式:全表扫描
第二种方式:根据索引检索。
为什么排序呢?
因为只有排序了才会有区间查找这么一说!(缩小扫描范围其实就是扫描某个区间罢了!)
在MySQL数据库当中索引也是需要排序的,并且这个排序和TreeSet数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在MySQL当中索引是一个B-Tree数据结构。
遵循左小右大原则存放,采用中序遍历方式遍历取数据。
2、索引的实现原理
在任何数据库当中主键上都会自动添加索引对象,另外在MySQL当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
在MySQL当中,索引是一个单独的对象,不同的存储引擎以不同的形式存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中,索引存储在一个逻辑名称叫做tablespace的当中,在MEMORY存储引擎当中索引被存储在内存当中,不管索引存储在哪里,索引在MySQL当中都是一个树的形式存在。(自平衡二叉树:B-Tree)
3、在MySQL当中,主键上,以及unique字段上都会自动添加索引!
一般什么条件下要考虑给字段添加索引呢?
- 数据量庞大(这个根据设备性能来定义)
- 该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描
- 该字段很少的进行DML(insert、delete、update)操作,因为DML之后,索引需要重新排序
4、索引的创建于删除
语法格式:create index emp_ename_index on emp(ename);
语法格式:drop index emp_ename_index on emp;
5、在MySQL中,查看一个SQL语句是否使用了索引进行检索
在查询语句前加explain
语法格式:explain select * from emp where ename = 'KING';
扫描了14条记录(表中一共14条数据),type=ALL,说明没有使用索引
扫描了一条记录,type=ref,说明使用了索引
6、索引失效
一、
模糊查询当中以“%”开头了, 无法使用索引!
尽量避免模糊查询的时候以“%”开始。
这也是一种优化的手段/策略。
二、
使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个字段上的索引也会失效。
注意:可以使用union,union不会让索引失效。
三、
使用复合索引的时候,没有使用左侧的列查找,索引失效
什么是复合索引?
两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引
没有使用左侧的列进行查找,那么索引失效。
四、
在where当中索引列参加了运算,索引失效。
五、
在where当中索引列使用了函数
7、索引是各种数据库进行优化的重要手段,优化的时候优先考虑的因素就是索引
索引在数据库当中分了很多类
单一索引:一个字段上添加索引
复合索引:两个字段或者更多的字段上添加索引
主键索引:主键上添加索引
唯一性索引:具有unique约束的字段上添加索引
注意:唯一性比较弱的字段上添加索引用处不大,因为可能会存在大量的重复数据,这个时候索引不起什么太大的作用,越唯一效率越高。