mysql基数是什么意思_谈谈MySQL中的基数是啥?

1基数是啥?

大白话讲:基数指的就是MySQL表中某一列的不同值的数量。

如果这一列是唯一索引,那基数 == 行数。

如果这一列是sex,枚举类型只有男女,那它是基数就是2。Cardinality越高,列就越有成为索引的价值。MySQL执行计划也会基于Cardinality选择索引。通过下面的方式可以看到表中各列的基数。

ef198f798184ff249c49d3d8989add17.png比如这个经典的例子:有一列为sex,那对于sex列中存储的值来说 非男即女,它的基数最大就是2。

那也就完全没有必要为sex建立索引。因为,为了提升你基于sex的查询速度,MySQL会为你选择的这个新索引创建一棵全新的B+Tree。但你sex只有两种值,对于MySQL来说,即使它为你指定的列建立了B+Tree索引,真正执行查询时,最多进行一次二分查询,剩下的操作只能是遍历,所以为sex创建索引意义不大。

2InnoDB更新基数的时机?

参数:innodb_stats_auto_recalc控制MySQL是否主动重新计算这些持久性的信息。默认为1表示true、0表示false。默认情况下当表中的行变化超过10%时,重新计算基数信息。

3基数是估算出来的!

基数并不会实时更新!而且它是通过采样估算出来的值!至于基数的公式是怎样的,可能并不重要。重要的是你得知道,它是通过随机采样数据页的方式统计出来的一个估算值。而且随机采样的页数可以通过参数:

innodb_stats_persistent_sample_pages设置,默认值是20。

这就意味着 基数值并不准确,甚至你每次计算的结果相差还是蛮大的。

4基数的持久化机制

可以通过参数innodb_stats_persistent控制是否持久化基数,默认为off。

当然你可以为一个单独的表设置 STATS_PERSISTENT=1那么它的

innodb_stats_persistent将自动被启用。

开启它的好处是:重启MySQL不会再重复计算这个值,加快重启速度。

5如何主动的更新基数?

执行下面的SQL时都会触发InnoDB更新基数(即使你并没有意识到它会更新基数)。所以尽量选择一个业务低峰期。analyze table tableName;

e08b908bba2b1475e1088b2e42de0bc2.png

如果因为采样的数量太少了,计算的基数就错的离谱。那很可能会导致MySQL的优化器选错索引。这时你可以将这个值适当调大。但是增加太多可能会导致ANALYZE TABLE运行缓慢。

反之,ANALYZE TABLE运行太慢。你可以适度调整参数innodb_stats_persistent_sample_pages的值。但是这又可能导致基数计算的不准确。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值