什么是索引
索引相当于一本书的目录,通过目录可以快速找到对应的资源。
在数据库方面,查询一张表的时候有两种检索方式:
- 全表扫描
- 根据索引检索(效率很高)
索引为什么可以提高检索效率?
其实根本上的原理是缩小了扫描的范围。
索引虽然可以提高检索效率,但是不能随意的添加索引,因为索引也是数据库中的对象,也需要数据库不断维护,有维护成本。
例如:表中的数据经常被修改,这样就不适合添加索引。
什么时候添加索引
- 数据量庞大(根据客户的需求,根据线上环境)
- 该字段很少进行DML操作(因为字段进行修改操作,索引也需要维护)
- 该字段经常出现在where字句中。(经常根据那个字段查询)
添加索引
-- 创建索引对象
create index 索引名称 on 表名(字段名);
-- 删除索引对象
drop index 索引名称 on 表名;
注意点
主键和具有unique约束的字段自动会添加索引。
根据主键查询效率较高。尽量根据主键检索。
-- 查看某段SQL的扫描方式 (type)
mysql> explain SELECT * FROM t_user;
+----+-------------+--------+------+---------------+------+---------+------+------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+--------+------+---------------+------+---------+------+------+-------+
| 1 | SIMPLE | t_user | ALL | NULL | NULL | NULL | NULL | 3 | |
+----+-------------+--------+------+---------------+------+---------+------+------+-------+
1 row in set (0.00 sec)
索引原理采用数据结构是:B + tree
索引搜索实现过程
graph LR
从name中查找SAM --> 从物理地址查找0x3
通过B Tree缩小索淼范围,底层索引进行了排序、分区,索引会携带数据在表中的“物理地址”,最终通过索引检索到数据之后,获取到关联的物理地址,通过物理地址定位表中的数据,效率是最高的。
SELECT ename FROM emp WHERE name = 'SAM';
通过索引转换为
SELECT ename FROM emp WHERE 物理地址 = 0x3;
索引的分类
- 单一索引:给单个字段加索引
- 复合索引:给多个字段联合起来添加1个索引
- 主键索引:主键上会自动添加索引
- 唯一索引:有unique约束的字段上会自动添加索引
索引什么时候会失效
-- 模糊查询的时候,第一个通配符使用%,这个时候索引是时效的
SELECT ename FROM emp WHERE ename LIKE '%A%';