mysql 直方图 索引_MYSQL 8 Histogram statistics 直方图,开始开挂的MYSQL

424d2b7b00535ba3b7b6b8452faff166.png

周六日,松懈了,罪过罪过, MYSQL 从8.0开始就开始正式走到开挂数据库得行列,估计8.0铺开后,大部分原先的MYSQL的经验的进行一次洗牌,今天就从MYSQL 的直方图开始。

MYSQL 从8.03 开始引入的直方图的功能,那什么是直方图,直方图对数据库的查询有什么帮助下面我们的学习一下。

首先数据库引入直方图的是大部分数据库早已经做的事情,2年前 TIDB 的一次讲座听了一下,当时TIDB 就引入了直方图。而MYSQL 到8.03 才引入直方图这个......

一个查询其实查询的就是每个列的值,并显示他,根据对应的条件,而条件也是从每列中获得的。那这里提出三个问题

1  每列中值到底有多少种

2  每列的每种值得数量有多少,那个多,那个少

3  一个表有多少行

通过上面三个问题,其实我们就可以算出一个百分比,一个列中的某个值在这列总行数的占比。下图仅仅是举例,这里仅仅是举例,直方图是有横纵坐标的,举例,横坐标是值域,会标注每个直方图中的每个区域的值域,而纵坐标是每个值域在整个表或列中的数量。

728b10557f7bbfd6932dcd9890196dd5.png

我们先不说更深的理论,我们先尝试着建立一个直方图,然后继续

bfabd4cba51a38abc34c5089584d8816.png

上面的图中

ANALYZE TABLE employees UPDATE HISTOGRAM ON first_name  WITH 32 BUCKETS;

通过上面的语句我们就创建了一个直方图,关于为什么 BUCKETS 是32 ,这是一个经验值,是官方推荐第一次建立直方图给定的值,当然这个值越大精度会越高,但调整到一定更高的数量后精度的提高就不会那么明显了,其实桶的数量和上图的横坐标有关,相当于每个值得范围会精细。

当然我们也可以给多个字段来建立直方图。

6dcd3607243fc1e0e2d0497a18a3e872.png

这里请注意,如果您多次为同一个字段建立直方图,那么最新建立的会覆盖之前的直方图。直方图的桶的数量是 1-1024,。

这里还要提醒一下,建立直方图的中可能由于输入的错误,输入了错误的字段名,而直方图会为错误的列名建立直方图,这点大家要知道。

801d0020fffc6d104c8e7e0c6fef3757.png

当然你可以删除你建立错误的直方图

8767f5f5e2f230119550987e4641de3d.png

而关于直方图的使用中有一个变量关于这个信息是否能放入到内存的限制,通过这个限制来对内存中是否能放入直方图进行了限制。

5729e00ac428cb4b7e41f670864cbc5b.png

聚德

下图

SELECT table_name,histogram->>'$."sampling-rate"'   FROM   information_schema.column_statistics   WHERE  table_name = "employees"  AND column_name = "first_name";

通过查询,可以看到我们创建了桶,到底有多少样例的数据被放入到了桶,16%

f96e843be91cbc6adaea05ec8d803973.png

说到这里,估计已经有人纳闷了,这个直方图到底有什么用,为什么不用索引,有索引更新索引的统计信息不就可以了。

我们看下面

1 我不建立索引

2  我查询数据 第一次不建立直方图

3  我建立直方图,不建立索引查询

3  我建立索引查询

先删除已经建立的直方图

ANALYZE TABLE employees drop HISTOGRAM ON last_name;

ANALYZE TABLE employees drop HISTOGRAM ON first_name;

查询数据

e85595db31dcc97f24bda2799d3429d5.png

我们可以看到filtered 是 20%

我们建立直方图

184716c0216f89edb6ae34de77a7e6ae.png

可以明确看到 filtered 过滤 11% 在没有索引的情况下,这是有利于查询的,或提高查询的性能的。

e0f6f4c7b59cb40ed82bfa1ec05edcd9.png

那么问题来了,如果我建立索引呢,其实你不用问,实际的答案一般是走索引快。

下面是走索引的查询时间

40285fb4af0baf1e6c4c3569acfefe62.png

在我删除索引后,整体的查询消耗 0.14秒

3695f41d38bf38b2d1bdec628b196742.png 在下图我再次去掉了直方图,并且在没有索引和直方图的情况下,化了0.15秒

56901e11f2919b8c002bbdd0b440c8f5.png

直方图作为一个MYSQL的新生事物,应该支持,但实在话目前属于鸡肋的技术

1  大部分老牌的数据库都有的功能

2  目前需要手动来建立更新

3   单纯使用直方图,对数据的查询的帮助有限

当然如果你不喜欢这个功能Set optimizer_switch=’condition_fanout_filter=off’;

可以将其关闭

如果你想知道,到底你建立了多少直方图

select * from information_schema.column_statistics\G

可以去查看 column_statistics 来获得数据

直方图目前可以作为索引查询的补充手段,并且以后的功能应该会变得更强,值得期待,MYSQL 从8.0 开始已经不再是互联网类的数据库,正在往全方位,企业级的数据迈进,当然面对 ORACLE  PG , MSSQL 这三位来说,在企业应用,前方的路还的努力!

1de952eb3cbde7c7c2cd023660ba6377.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值