数据库优化器/收集统计信息

最新推荐文章于 2023-07-05 14:09:57 发布

小萨_Joshua

最新推荐文章于 2023-07-05 14:09:57 发布

阅读量324

点赞数 1

分类专栏：数据仓库文章标签：数据库

本文链接：https://blog.csdn.net/weixin_45283159/article/details/122403209

版权

数据仓库专栏收录该内容

5 篇文章 0 订阅

订阅专栏

数据库优化器分为基于规则基于代价
举例去火车站买票
基于代价使用地图来算
基于规则按照习惯去走
所以
对于OLAP 多用于不同的查询sal多样，多使用基于代价
对于OLTP 在某个系统是固定的，多使用基于规则
基于代价优化器,就会使用到统计信息
统计信息放在数据字典里(oracle 有自己的数据字典类似user_tables user_column user_index impala 数据字典一般存在mysql )
对于某一列所有的值(即集合) 会分成200-250个隔断，如存在一张250000行数据的表分为250个隔断，每个隔断存放1000行数据,隔断存极值平常值(个数行数) 空值把所有的数做了一个统计即统计信息
举例对于where city="宁波’and prod_type='信贷
数据库表中宁波5条信贷1000条会先执行5条

流程
首先数据库会查看表头是不是catch到内存当中
如果没有从物理字典拿
如果有随机选择一个计算单元，找数据字典的信息的一段即样本如白分之1 15节点个数估算
通过统计信息列的空值最小值最大值平常值等用估算的值，和物理的真正的统计信息对比，统计信息在一定误差内，则认为近视准的，(因为时间过长,表内存放的统计信息可能不准确)

在执行计划没有发生改变的情况下一般不收集统计信息
收集统计信息会全表扫描
IO的腾挪<<内存运算速度
impala是将数据catch到内存 impala适合查询,不适合跑批
收集统计信息收集哪些字段有意义 where join partition
分区 partition
有日期，可避免全表扫描 partition就是表多个表类似union在一起 partition
分为范围和哈希 partition上可以建partition 范围之上可以建哈希范围但是哈希向下建不了)
真正存在，不能直接访问 partition 索引(真正存储数据的只有表和索引)

小萨_Joshua

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据库优化器/收集统计信息

数据库优化器分为基于规则基于代价举例去火车站买票基于代价使用地图来算基于规则按照习惯去走所以对于OLAP 多用于不同的查询sal多样，多使用基于代价对于OLTP 在某个系统是固定的，多使用基于规则基于代价优化器,就会使用到统计信息统计信息放在数据字典里(oracle 有自己的数据字典类似user_tables user_column user_index impala 数据字典一般存在mysql )对于某一列所有的值(即集合) 会分成200-250个隔断，如存在一张250
复制链接

扫一扫