mysql 索引 重复_MySQL 重复索引探讨(持续更新中...)

本文探讨了MySQL中存在的一些索引问题,包括包含主键的索引、重复的索引(前缀索引的冗余)、低区分度索引和复合主键对性能的影响。通过SQL查询,可以找出这些问题并进行优化,以提高数据库效率。
摘要由CSDN通过智能技术生成

创建'有问题的'表

1.创建表test1

CREATE TABLE test1 (

id int(11) NOT NULL,

f1 int(11) DEFAULT NULL,

f2 int(11) DEFAULT NULL,

f3 int(11) DEFAULT NULL,

PRIMARY KEY (id),

KEY k1 (f1,id),

KEY k2 (id,f1),

KEY k3 (f1),

KEY k4 (f1,f3),

KEY k5 (f1,f3,f2)

)

2.创建表 test2

CREATE TABLE test2 (

id1 int(11) NOT NULL DEFAULT 0,

id2 int(11) NOT NULL DEFAULT 0,

b int(11) DEFAULT NULL,

PRIMARY KEY (id1,id2),

KEY k1 (b)

)

存在问题的索引

1. 包含主键的索引

innodb 本身是聚簇表,每个二级索引本身就包含主键,类似f1,id 的索引,虽然实际没什么害处,但反映使用者对mysql 索引的不了解。而 id,f1 这种多余索引,会浪费存储空间,并影响数据更新性能。包含主键的索引用这样一句sql 就能全部找出来:

select c.*, pk from

(select table_schema, table_name, index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols

from INFORMATION_SCHEMA.STATISTICS

where index_name != 'PRIMARY' and table_schema != 'mysql'

group by table_schema, table_name, index_name) c,

(select table_schema, table_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') pk

from INFORMATION_SCHEMA.STATISTICS

where index_name = 'PRIMARY' and table_schema != 'mysql'

group by table_schema, table_name) p

where c.table_name = p.table_name and c.table_schema = p.table_schema and c.cols like concat('%', pk, '%');

结果:

136ba41d53e9931f5d2b1a7517f71223.png

2.重复的索引

包含重复前缀的索引,索引能由另一个包含该前缀的索引完全代替,是多余索引。多余的索引会浪费存储空间,并影响数据更新性能。这样的索引同样用一句 sql 可以找出来。

select c1.table_schema, c1.table_name, c1.index_name,c1.cols,c2.index_name, c2.cols from

(select table_schema, table_name, index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols

from INFORMATION_SCHEMA.STATISTICS

where table_schema != 'mysql' and index_name!='PRIMARY'

group by table_schema,table_name,index_name) c1,

(select table_schema, table_name,index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols

from INFORMATION_SCHEMA.STATISTICS

where table_schema != 'mysql' and index_name != 'PRIMARY'

group by table_schema, table_name, index_name) c2

where c1.table_name = c2.table_name and c1.table_schema = c2.table_schema and c1.cols like concat(c2.cols, '%') and c1.index_name != c2.index_name;

结果:

088da28423ac58b5b70efddbd0bb7368.png

2.2 关于冗余索引,补充一些

如果创建了索引(A,B),再创建索引(A),则(A) 是冗余索引,因为这只是前一个索引的前缀索引。

因此索引(A,B)也可以当做索引(A)来使用(这种冗余只是对B-Tree 索引来说的)。

但是如果再创建索引(B,A),则不是冗余索引,索引(B)也不是,因为B 不是索引(A,B)的最左前缀列。

另外,其它不同类型的索引(如哈希索引或者全文索引)也不会是B-Tree 索引的冗余索引,而无论覆盖的索引列是什么。

3. 低区分度索引

这样的索引由于仍然会扫描大量记录,在实际查询时通常会被忽略。但是在某些情况下仍然是有用的。因此需要根据实际情况进一步分析。这里是区分度小于 10% 的索引,可以根据需要调整参数。

select p.table_schema, p.table_name, c.index_name, c.car, p.car total from

(select table_schema, table_name, index_name, max(cardinality) car

from INFORMATION_SCHEMA.STATISTICS

where index_name != 'PRIMARY'

group by table_schema, table_name,index_name) c,

(select table_schema, table_name, max(cardinality) car

from INFORMATION_SCHEMA.STATISTICS

where index_name = 'PRIMARY' and table_schema != 'mysql'

group by table_schema,table_name) p

where c.table_name = p.table_name and c.table_schema = p.table_schema and p.car > 0 and c.car / p.car 

结果:

15723c4860be563b37e34733a2e4ca04.png

4. 复合主键

由于 innodb 是聚簇表,每个二级索引都会包含主键值。复合主键会造成二级索引庞大,而影响二级索引查询性能,并影响更新性能。同样需要根据实际情况进一步分析。

sql 为:

select table_schema, table_name, group_concat(column_name order by seq_in_index separator ',') cols, max(seq_in_index) len

from INFORMATION_SCHEMA.STATISTICS

where index_name = 'PRIMARY' and table_schema != 'mysql'

group by table_schema, table_name having len>1;

结果为:

7c506374f10b1dd6e70f4e908fbb2da4.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值