物化和延迟物化

本文探讨了物化和延迟物化的概念,区别于物化视图,重点在于数据转换的过程。物化是指将数据从中间形态转换为原始形态,而延迟物化则是尽可能将物化操作推迟到查询生命周期的后期,以减少开销并提高缓存利用率。通过示例展示了延迟物化如何在列式存储中优化查询性能。
摘要由CSDN通过智能技术生成

大家首先需要把物化、延迟物化的概念和物化视图的概念区分开来。关于视图和物化视图的概念这里不再赘述。

物化,顾名思义就是物理转换,对于数据来说,物化表示把数据由某个中间形态转换成原始,真实的形态。有点抽象,如下所示,我们以人名为例,name=YANDONG,YANDONG就是真实的物理表示,但是在软件系统中,为了实现计算和存储的优化,会对原始数据做各种中间形态转换,如字典映射,压缩等等。但是数据最后还是要表现它的真实形态的(真实形态才有意义),这时候就需要通过物化,将中间形态转换为原始形态

 

    从用户角度看,Row结构的数据更契合用户查询习惯,因此为了把列式存储的Column格式,跟用户查询习惯和表达意思对应上,需要把数据转换成Row格式,这属于列式存储里面的物化。

    清楚了物化的概念之后,延迟物化就比较好理解了,其实就是把物化尽量移到查询计算生命周期的末尾。通俗讲,中间状态是优化过程,尽可能让优化过程占据生命周期。以下面的查询为例(列存):

    select name from tb where id > 10 and age > 30

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值