msyq的索引

woyouyitouchenfeijv

已于 2023-03-14 17:04:28 修改

阅读量270

点赞数

分类专栏：数据库文章标签： mysql Powered by 金山文档

于 2023-03-12 23:31:25 首次发布

本文链接：https://blog.csdn.net/qq_37761711/article/details/129477379

版权

数据库专栏收录该内容

1 篇文章 0 订阅

订阅专栏

索引分类

按类型分类

普通索引 - NORMAL

普通索引就是经常用的那种，包括组合索引也是

唯一索引 - UNIQUE

唯一值

全文索引 - FULLTEXT

5.6 及以后的版本才支持

只有字段的数据类型为 char、varchar、text 及其系列才可以建全文索引

全文索引作用就是类似于like的范围查找，在大数据量的like下，比 like + % 快 N 倍，但是可能存在精度问题；

如果需要全文索引的是大量数据，建议先添加数据，再创建索引；

对于中文，可以使用 MySQL 5.7.6 之后的版本，或者第三方插件。

空间索引 - SPATIAL

是对空间数据类型的字段建立的索引，MySQL中的空间数据类型有4种，分别是GEOMETRY、POINT、LINESTRING和POLYGON

只能在存储引擎为MyISAM的表中创建

上面4个是创建时候就可以看到的

主键索引

创建表时候自动创建的

按存储结构分类

B+树

Hash

只有Memory引擎显式的支持哈希搜索

哈希只支持等值比较，不支持任何范围查询。一旦哈希冲突很多的话，维护成本非常高。innoDB支持“自适应哈希索引”(adaptive hash index)。

查看是否使用索引

使用explain关键字，如果possible_keys行和key行都包含year_publication字段，则说明在查询时使用了该索引。

select查询的序列号，包含一组数字，表示查询中执行select子句或者操作表的顺序

select_type

主要用来分辨查询的类型，是普通查询还是联合查询还是子查询

table

对应行正在访问哪一个表，表名或者别名，可能是临时表或者union合并结果集

1、如果是具体的表名，则表明从实际的物理表中获取数据，当然也可以是表的别名

2、表名是derivedN的形式，表示使用了id为N的查询产生的衍生表

3、当有union result的时候，表名是union n1,n2等的形式，n1,n2表示参与union的id

type

type显示的是访问类型，访问类型表示我是以何种方式去访问我们的数据，最容易想的是全表扫描，直接暴力的遍历一张表去寻找需要的数据，效率非常低下，访问的类型有很多，效率从最好到最坏依次是：

**system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL **

一般情况下，得保证查询至少达到range级别，最好能达到ref

possible_keys

用了哪些索引

实际使用的索引，如果为null，则没有使用索引，查询中若使用了覆盖索引，则该索引和查询的select字段重叠。

key_len

表示索引中使用的字节数，可以通过key_len计算查询中使用的索引长度，在不损失精度的情况下长度越短越好。

显示索引的哪一列被使用了，如果可能的话，是一个常数

rows

根据表的统计信息及索引使用情况，大致估算出找出所需记录需要读取的行数，此参数很重要，直接反应的sql找了多少数据，在完成目的的情况下越少越好

extra

包含额外的信息。

--using filesort:说明mysql无法利用索引进行排序，只能利用排序算法进行排序，会消耗额外的位置

--using temporary:建立临时表来保存中间结果，查询完成之后把临时表删除

--using index:这个表示当前的查询时覆盖索引的，直接从索引中读取数据，而不用访问数据表。如果同时出现using where 表名索引被用来执行索引键值的查找，如果没有，表明索引被用来读取数据，而不是真的查找

--using where:使用where进行条件过滤

--using join buffer:使用连接缓存

--impossible where：where语句的结果总是false

聚簇索引和非聚簇索引

聚簇索引

不是单独的索引类型，而是一种数据存储方式，指的是数据行跟相邻的索引紧凑的存储在一起。也就是存一张数据文件里

优点1、数据在一个文件夹2、访问快，因为叶子节点上就有数据3、使用覆盖索引扫描的查询可以直接使用页节点中的主键值

缺点1、聚簇数据最大限度地提高了IO密集型应用的性能，如果数据全部在内存，那么聚簇索引就没有什么优势2、插入速度严重依赖于插入顺序，按照主键的顺序插入是最快的方式。数据太大的话就会引起页分裂问题3、更新聚簇索引列的代价很高，因为会强制将每个被更新的行移动到新的位置

4、基于聚簇索引的表在插入新行，或者主键被更新导致需要移动行的时候，可能面临页分裂的问题

聚簇索引可能导致全表扫描变慢，尤其是行比较稀疏，或者由于页分裂导致数据存储不连续的时候

mysq页合并、页分裂

MySQL 5.6版本开始innodb_file_per_table参数默认设置为1。该配置下你的每一个表都会单独作为一个文件存储（如果有分区也可能有多个文件）。一个文件里有多个段(segments)，每个段由多个区组成，每个区由多个页组成。

每个页默认16kb 10384字符
每个区默认1M因此一个区是64个页

每个页面都有一个MERGE_THRESHOLD字段，默认是每页的50%大小。

当当前页面的最后一个数据存入发现存不下，就可能发生页分裂。反之MERGE_THRESHOLD< 50%，就会向前找一个页，进行页合并。

页合并和页分裂，都是不是按顺序去加页

比如已经有了#11和#12。当给#11存入数据过大，分裂一个#13，会在#11和#12中间导致页顺序乱了。这个时候就需要重新整理表。另一方面，要记住在合并和分裂的过程，InnoDB会在索引树上加写锁（x-latch）。在操作频繁的系统中这可能会是个隐患

非聚簇索引

数据文件跟索引文件分开存放

索引重构

当深度>=4 或者DEL_LF_ROWS/LF_ROWS>0.2或索引左右倾斜的情况下就要重建

删掉原索引，然后再创建索引： create index index_name on table_name (index_column); 这种方式相当耗时。

直接重建索引：alter index indexname rebuild online; 此方法较快，建议使用。

rebuild是快速重建索引的一种有效的办法，因为它是一种使用现有索引项来重建新索引的方法。alter index indexname rebuild就可以创建索引，但是为了防止重建索引时有其他用户在对这个表操作，尽量使用带online参数来最大限度的减少索引重建时将会出现的任何加锁问题。由于新旧索引在建立时同时存在，因此，使用这种重建方法需要有额外的磁盘空间可供临时使用，当索引建完后把老索引删除，如果没有成功，也不会影响原来的索引。利用这种办法可以用来将一个索引移到新的表空间。

索引失效

最佳左前缀法则

计算、函数、类型转换(自动或手动)导致索引失效

范围条件右边的列索引失效

不等于(!= 或者<>)导致索引失效

is null可以使用索引，is not null无法使用索引

like以通配符%开头索引失效

这个看到个有趣的设计，比如想要用like，但是%只能放后面。然后就有个空间换时间的操作，当前列(寸12345)外再加一列逆序(寸54321)。然后就可以like 后%相当于前一列的like前%。

OR 前后只要存在非索引的列，都会导致索引失效?

左连接查询或者右连接查询查询关联的字段编码格式不一样

mysql认为不走索引更快的情况

最后，自测的一个索引覆盖小场景

当使用了组合索引name 和age，查询sql是select name where age时候，因为索引的叶子节点有这两个数据，不需要再去数据库表查询。就是使用了索引覆盖。但是效率type = index。

当只用单独age索引后，但是查询type = ref

woyouyitouchenfeijv

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
msyq的索引

由于新旧索引在建立时同时存在，因此，使用这种重建方法需要有额外的磁盘空间可供临时使用，当索引建完后把老索引删除，如果没有成功，也不会影响原来的索引。当给#11存入数据过大，分裂一个#13，会在#11和#12中间导致页顺序乱了。type显示的是访问类型，访问类型表示我是以何种方式去访问我们的数据，最容易想的是全表扫描，直接暴力的遍历一张表去寻找需要的数据，效率非常低下，访问的类型有很多，效率。实际使用的索引，如果为null，则没有使用索引，查询中若使用了覆盖索引，则该索引和查询的select字段重叠。
复制链接

扫一扫

专栏目录