mysql like 原理_MySQL索引原理

数据库索引本质上是一种数据结构(B+存储结构+算法),目的是为了加快数据检索速度。

1、索引的类型

主键索引:给表设置主键,这个表就拥有主键索引。

唯一索引:unique

普通索引:增加某个字段的索引,比如用户表根据用户名查询。

组合索引:使用多个字段创建索引,遵循最左原则,比如创建索引(col1 + col2 + col3),相当于创建了(col1)、(col1,col2)、(col,col2,col3)三个索引。

全文索引:

2、聚簇索引与非聚簇索引

MySQL的InnoDB引擎主键使用的是聚簇索引;MyISAM引擎不管是主键索引,还是二级索引使用的都是非聚簇索引。

7ad600748bb4bdadb6719d1487aeae9e.png

非聚簇索引(右图):数据和索引分开存储结构。

主键索引和二级索引存储上没有任何区别。

所有的节点都是索引,叶子节点存储数据(key)和数据地址。

809a7065285c856423efd3716f252ce0.png

聚簇索引(左图):数据和索引一起存储结构,找到索引就找到数据。

主键索引的叶结点存储数据记录(包含主键值)。

二级(其他)索引的叶结点存储key值和对应数据记录的主键值。非叶子节点只存储索引(key)关键字,不存储对应数据记录的具体内容或内容地址。叶子节点上的数据是主键与具体记录(数据内容)。

161059960eb201d66b2544117589a440.png 

3be11033d65c8325d6d39e971e95e615.png

聚簇索引优点:

①如果需要查询一定范围内的数据,聚簇索引比非聚簇索引好。

②当通过聚簇索引查找目标数据时,理论上比非聚簇索引要快(因为非聚簇索引定位到对应主键后,还要多一次目标记录寻址,即多一次I/O)。

聚簇索引缺点:

①插入速度严重依赖于插入顺序,按照主键顺序插入是最快的方式;否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键。

②同时更新主键的代价很高,因为将会导致被更新的行数据移动。因此,对于InnoDB表,我们一般定义主键为不可更新。

③二级(其他)索引访问需要两次索引查找,第一次找到数据记录主键值,第二次根据主键值在主键索引中检索数据记录。二级索引的叶节点存储的是主键值,而不是行指针(非聚簇索引存储的是指针或者说是地址),这是为了减少在出现行移动或数据页分裂时的二级索引的维护工作,但会让二级索引占用更多的空间。

④采用聚簇索引插入新值比采用非聚簇索引插入新值的速度要慢很多(因为插入要保证主键不能重复,判断主键不能重复,采用的方式在不同的索引下面会有很大的性能差距:聚簇索引遍历所有的叶子节点;非聚簇索引也判断所有的叶子节点,但是聚簇索引的叶子节点除了带有主键还有数据记录,记录的大小往往比主键要大的多。这样就会导致聚簇索引在判定新记录携带的主键是否重复时进行昂贵的I/O代价。

3、索引实践

#创建班级表

1 CREATE TABLEclass (2 pid INTEGER not nullAUTO_INCREMENT,3 code VARCHAR(200) not null,4 name VARCHAR(200) not null,5 created_by VARCHAR(200),6 created_date DATE,7 updated_by VARCHAR(200),8 updated_date DATE,9 CONSTRAINT pk_class_pid PRIMARY KEY(pid)10 );

#插入数据

insert into stu.class (code,name,created_by,created_date,updated_by,updated_date)

values

( '1-001', '一年级1班','system', NOW(),'system',NOW()),

( '1-002', '一年级2班','system', NOW(),'system',NOW()),

( '2-001', '二年级1班','system', NOW(),'system',NOW()),

( '2-002', '二年级2班','system', NOW(),'system',NOW());

#使用主键索引

EXPLAIN

select * from class where pid = 2;

71cdf3fa6c2943ff80dda31cd2fa910c.png

#创建普通索引

CREATE INDEX idx_class_class_code ON class(class_code);

#使用索引

EXPLAIN

select * from class where code = '2-001';

08bdd0569a0b61fbefb448df68ff0dd8.png

IN查询:

EXPLAINSELECT * FROM class WHERE code in ('1-001','1-002','2-001');

ca36586e5043993af600d87d44d93e32.png

LIKE查询:

EXPLAINSELECT * FROM class WHERE code like '%-001%'; #左右like

d8c7b86bf5a9f0ae0d729518a71d4409.png

EXPLAIN

SELECT * FROM class WHERE code like '%-001'; #右like

90a43e4908efe7759b310e7c6ba18302.png

EXPLAIN

SELECT * FROM class WHERE code like '1-001%'; #左like

9504b9849440ccc8351354d1125c4c3b.png

创建组合索引

CREATE INDEX idx_class_class_code_name ON class(code,name);

#使用索引

EXPLAIN

select * from class where code = '2-001' and name = '一年级2班';

#使用索引,组合索引所有字段与顺序无关

EXPLAIN

select * from class where name = '一年级2班' and code = '2-001';

ceafec378fadf60b5dce46fa53b399a0.png

我自己想:应该是数据在执行时会进行SQL优化。

#组合索引只使用第一个字段时,索引可生效

EXPLAINSELECT * FROM class WHERE code = '1-001';

a49c0bc908750c90452209e563a9af72.png

EXPLAINSELECT * FROM class WHERE name = '一年级1班';

606cc4c7be0486e791d728dbde41f9db.png

查询时,组合索引中间有其他字段条件:

EXPLAINSELECT * FROM class WHERE code = '1-001' and created_by = 'system' and name = '一年级1班';

77ee174edc9f82534ef7b9387714c47a.png

可以看到,此时查询时索引也生效了。

#删除索引

DROP INDEX idx_class_class_code ON class;

EXPLAIN

select * from class where code = '2-001';

33a7c7dac63807991fe4c2a5f5808fbc.png

#未使用索引,遵循最左原则

EXPLAIN

select * from class where name = '一年级2班';

84504e717165fccdb1d1c121a031e0c1.png

#创建唯一索引

CREATE UNIQUE INDEX idx_uq_class_class_code ON class(code);

#删除已有的组合索引

DROP INDEX idx_class_class_code_name ON class;

#使用唯一索引

EXPLAIN

select * from class where code = '2-001';

94cc1b4b26e1c25cfa5bffbd359389a6.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值