mysql 重复率高字段 索引,为什么重复值高的字段不能建索引(+聚集索引和非聚集索引)...

[TOC]

# 一、原因:

- 非聚簇索引存储了对主键的引用,如果 select 字段不在非聚簇索引内,就需要跳到主键索引。 - 如果非聚簇索引值重复率高,那么查询时就会大量出现上图中从右边跳到左边的情况,导致整个流程很慢

原因就是上面的。 数据库中聚集索引只有一个,默认主键。其他用户创建的索引都是非聚集索引。 非聚集索引存储了对主键的引用,即通过索引确定叶子节点之后,还需要再次根据主键去查询数据。(所以会查询两次) 如果非聚集索引重复率高(即一个同样的值有多个主键),那么首先你会从索引中取一半主键值,然后根据主键值再去查询数据,增加了IO,所以特别耗时。

大概就是上面的原因。

# 二、聚集索引和非聚集索引

## 2.1 区别: 主要可以参考高性能MySQL。这里简单总结一下

- 聚集索引把索引和数据存在了一起。   可以这么理解,聚集索引的叶子节点存储的是数据的指针(或者是数据本身)。具体暂时不确定,后续了解之后再确定。 - 非聚集索引(也叫二级索引)的叶子节点存储的是主键值(或叫做聚集索引值)

## 2.2 查询次数

非聚集索引需要两次查找,先从非聚集索引中找到主键值,然后再去聚集索引中找到具体数据。 聚集索引只需要查找本身。

## 2.3 为什么不适合在枚举少的字段上建立索引? 如果聚集索引唯一,那么条件只会确定几条值的主键,然后去聚集索引中查询还可以。 如果聚集索引重复,那么条件会确定近乎一般或者1/3或者1/5的主键值,然后再一个一个去聚集索引中查询,就会引起问题。

## 2.4 如果没有索引,数据库是怎么查询的?

全表扫描。

如果索引可以减少全表扫描,那么索引有效。如果索引导致了比全表扫描更糟糕的结果,那么还不如全表扫描。

#  三、参考

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值