MySQL索引,为什么索引可以加速查询
1.索引是什么
索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址,在数据十分庞大的时候,索引可以大大加快查询的速度,这是因为使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据。
2.创建索引的语法
2.1 在创建表的时候添加索引
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) ## 在创建表的时候直接添加索引 );
2.2 在创建表以后添加索引
ALTER TABLE my_table ADD [UNIQUE] INDEX index_name(column_name); 或者 CREATE INDEX index_name ON my_table(column_name);
注意:
1、索引需要占用磁盘空间(mysql根据不同的存储引擎会生成不同名字的索引文件),因此在创建索引时要考虑到磁盘空间是否足够
2、创建索引时需要对表加锁,因此实际操作中需要在业务空闲期间进行
2.3删除索引
DROP INDEX my_index ON tablename; 或者 ALTER TABLE table_name DROP INDEX index_name;
2.4 查看表中的索引
SHOW INDEX FROM tablename
3 查看索引使用
//explain 加查询语句 会出现一个查询结果如下图
3.1字段解释
(1)id:
-
id有三种值:决定表的读取顺序
1)id相同,表执行顺序由上到下,与sql中顺序无关
(2)id不同,
如以上子查询,id的序号会递增,id值越大优先级越高,越先被执行
(3)id相同有不同
id 如果相同,可以认为是一组,从上往下顺序执行;(衍生 = derived)
在所有组中,id值越大,优先级越高,越先执行
(2)select_type
select_type 一般有六种类别
(1)simple
简单查询,查询中不包含子查询或者union等任何复杂查询
(2)primary
查询中若包含任何复杂的子查询,则最外层被标记为paimary,俗称是鸡蛋壳
(3)subquery
在select或where列表包含了子查询
(4)derived
在from列表中包含的子查询被标记为derived(衍生),mysql会递归执行这些子查询,把结果放在临时表里(临时表会增加系统负担,但有时不得不用)
(5)union
若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为:derived
(6)union result 两种union结果的合并
(3)table
显示这个sql中涉及到的表名
(4)partitions
(5)type
显示这个查询语句中用没有用到索引,用到的索引类型是什么,是对sql进行优化的重要参考值.
type有以下几个类型:
system > const > eq_ref > ref > range > index > all(全表扫描,当表中有索引,并且在查询语句中用到索引,但是type的值却为all,要对sql进行优化了)
(1)system
表只要一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计
(2)const
表示通过索引一次就找到了,const用于比较primary key 或者 unique索引,因为只匹配一行数据,所以很快,如将主键置于where列表中,mysql就能将该查询转换为一个常量。
(3)eq_ref
唯一性索引扫描。对于每个索引建,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
(4)ref
非唯一性索引扫描,返回匹配某个单独值得所有行,本质上也是一种索引访问,它返回所有匹配某个单独值得行,然而它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
(5)range
只检索给定范围的行,使用一个索引来选择行,key 列显示使用了哪个索引,一般就是你的where语句中出现了between、<、>、in等的查询(mysql5.7支持in走索引),这种范围扫描索引扫描比全表扫描好,因为它至于要开始索引的某一点,而结束语另一点,不用扫描全部索引
(6)index
full index scan(全索引扫描),index与all区别为index类型只遍历索引树,这通常比all块,因为索引文件通常比数据文件小。(也就是说虽然all和index都是读全表,单index是从索引中读取的,而all是从硬盘中读的)
(7)all 全表扫描
(6)possible_keys
** 显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用**
(7)key
** 实际上使用到的索引,如果为null,则没有使用索引**
查询中若使用了(覆盖索引),则该索引仅出现在key列表中,
覆盖索引:
就是说我select 字段1,字段2,与我建立的符合索引个数和顺序一致就称为覆盖索引查询。例如:建的索引 字段一 字段二,查的也是字段一、字段二。理解方式一:就是select 的数据列只用从索引中就能够取得,不必读取数据行,mysql可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖,一个索引包含了(或覆盖了)满足查询结果的数据就叫做覆盖索引。
注意: 如果要使用覆盖索引,一定要注意select列表中只取出需要的列,不可select *
(8)key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短查询的效率越高.
(9)ref
** 显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值**
(10)rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数(越少越好),每张表有多少行被优化器查询
(11)Extra
包含不适合在其他列显示但是很重要的额外信息
1)using filrsort(九死一生)
说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。mysql中无法利用索引完成的排序操作称为"文件排序",一旦出现这种情况很危险。
(2)using index
使用到了索引、这种情况是好事。表示响应的select操作中使用了覆盖索引(cocering index),避免访问了表的数据行,效率不错!如果同时出现了using where,表名索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查找动作。
(3)using where
使用了where条件
(4)using temporary(十死无生)
使用了临时表保存中间结果。mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询 group by。(group by 最好与索引的字段、顺序一致)
4 索引的使用策略
4.1什么时候要使用索引?
主键自动建立唯一索引;经常作为查询条件在WHERE或者ORDER BY 语句中出现的列要建立索引;作为排序的列要建立索引;查询中与其他表关联的字段,外键关系建立索引高并发条件下倾向组合索引;用于聚合函数的列可以建立索引,例如使用了max(column_1)或者count(column_1)时的column_1就需要建立索引
4.2 什么时候不要使用索引?
1.经常增删改的列不要建立索引;2.有大量重复的列不建立索引;表记录太少不要建立索引。
3.只有当数据库里已经有了足够多的测试数据时,它的性能测试结果才有实际参考价值。如果在测试数据库里只有几百条数据记录,它们往往在执行完第一条查询命令之后就被全部加载到内存里,这将使后续的查询命令都执行得非常快--不管有没有使用索引。只有当数据库里的记录超过了1000条、数据总量也超过了MySQL服务器上的内存总量时,数据库的性能测试结果才有意义。
4.3索引失效的情况(sql优化专用):
(1)
在组合索引中不能有列的值为NULL,如果有,那么这一列对组合索引就是无效的。
(2)
在一个SELECT语句中,索引只能使用一次,如果在WHERE中使用了,那么在ORDER BY中就不要用了。
(3)
LIKE操作中,'%aaa%'不会使用索引,也就是索引会失效,但是‘aaa%’可以使用索引。
(4)
在索引的列上使用表达式或者函数会使索引失效,例如:select * from users where YEAR(adddate)<2007, 将在每个行上进行运算,这将导致索引失效而进行全表扫描,因此我们可以改成:select * from users where adddate<’2007-01-01′。其它通配符同样,也就是说,在查询条件中使用正则表达式时,只有在搜索模板的第一个字符不是通配符的情况下才能使用索引。
(5)
在查询条件中使用不等于,包括<符号、>符号和!=会导致索引失效。特别的是如果对主键索引使用!=则不会使索引失效,如果对主键索引或者整数类型的索引使用<符号或者>符号不会使索引失效。(经erwkjrfhjwkdb同学提醒,不等于,包括符号、>符号和!,如果占总记录的比例很小的话,也不会失效)
(6)
在查询条件中使用IS NULL或者IS NOT NULL会导致索引失效。
(7)
字符串不加单引号会导致索引失效。更准确的说是类型不一致会导致失效,比如字段email是字符串类型的,使用WHERE email=99999 则会导致失败,应该改为WHERE email='99999'。
(8)
在查询条件中使用OR连接多个条件会导致索引失效,除非OR链接的每个条件都加上索引,这时应该改为两次查询,然后用UNION ALL连接起来。
(9)
如果排序的字段使用了索引,那么select的字段也要是索引字段,否则索引失效。特别的是如果排序的是主键索引则select * 也不会导致索引失效。
尽量不要包括多列排序,如果一定要,最好为这队列构建组合索