MySQL为什么有时候会选错索引？

最新推荐文章于 2022-10-20 16:16:34 发布

Thxxxxxx

最新推荐文章于 2022-10-20 16:16:34 发布

阅读量282

点赞数

分类专栏： MySQL

MySQL 专栏收录该内容

37 篇文章 0 订阅

订阅专栏

选择索引是优化器的工作。。。

优化器选择索引的目的，是找到一个最优的执行方案，并用最小的代价去执行语句。通过三个指标进行选择：

扫描行数
是否使用临时表
是否排序

扫描行数是怎么判断的？

MySQL 在真正开始执行语句之前，并不能精确地知道满足这个条件的记录有多少条，而只能根据统计信息来估算记录数。这个统计信息就是索引的“区分度”。显然，一个索引上不同的值越多，这个索引的区分度就越好。而一个索引上不同的值的个数，我们称之为“基数”（cardinality）。也就是说，这个基数越大，索引的区分度越好。我们可以使用 show index 方法，看到一个索引的基数。如图 4 所示，就是表 t 的 show index 的结果。虽然这个表的每一行的三个字段值都是一样的，但是在统计信息中，这三个索引的基数值并不同，而且其实都不准确。

那么，MySQL 是怎样得到索引的基数的呢？这里，我给你简单介绍一下 MySQL 采样统计的方法。

为什么要采样统计呢？因为把整张表取出来一行行统计，虽然可以得到精确的结果，但是代价太高了，所以只能选择“采样统计”。采样统计的时候，InnoDB 默认会选择 N 个数据页，统计这些页面上的不同值，得到一个平均值，然后乘以这个索引的页面数，就得到了这个索引的基数。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySQL为什么有时候会选错索引？

选择索引是优化器的工作。。。优化器选择索引的目的，是找到一个最优的执行方案，并用最小的代价去执行语句。通过三个指标进行选择：扫描行数是否使用临时表是否排序扫描行数是怎么判断的？MySQL 在真正开始执行语句之前，并不能精确地知道满足这个条件的记录有多少条，而只能根据统计信息来估算记录数。这个统计信息就是索引的“区分度”。显然，一个索引上不同的值越多，这个索引的区分度就越 ...
复制链接

扫一扫

专栏目录

Thxxxxxx CSDN认证博客专家 CSDN认证企业博客

码龄9年

97: 原创

25万+: 周排名

178万+: 总排名

21万+: 访问

: 等级

2824: 积分

29: 粉丝

113: 获赞

35: 评论

358: 收藏

私信

关注

热门文章

分类专栏

git 3篇
Java 34篇
大白话 5篇
Dubbo 2篇
Spring 21篇
MySQL 37篇
网易云课堂笔记 10篇
net 13篇
机器学习 1篇
Pyhton 1篇
随手写
Java并发 11篇
Tomcat 1篇
面经 7篇
Mybatis 6篇
乱七八糟 6篇
Java集合 18篇
JVM 6篇
MQ 3篇
操作系统 4篇
Redis 5篇
算法

最新评论

年轻代为什么要设置两个Survivor区
张小豪: 移动到Survivor区本身不就解决碎片化了吗？为什么还需要两个Survivor区？
ACK机制
AdiosZW: 概念不太一样吧，ACK就是一个确认应答
CopyOnWriteArrayList的addIfAbsent()方法
Thxxxxxx: 学生时候记录自己写的东西，你和我谈专业？
CopyOnWriteArrayList的addIfAbsent()方法
Thxxxxxx: 是的，注释写错了，但是上面解释应该没问题把
CopyOnWriteArrayList的addIfAbsent()方法
乐韵天城: 能不能专业点，明明时元素存在的时候再放入会返回false

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。