Google Dremel数据模型详解(下)

最新推荐文章于 2023-07-08 09:27:15 发布

cdai

最新推荐文章于 2023-07-08 09:27:15 发布

阅读量4.7k

点赞数

分类专栏：实时计算内存计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dc_726/article/details/41777619

版权

本文深入探讨了Google Dremel数据模型中的关键概念r和d，阐述它们在数据结构和有限状态机（FSM）执行中的作用。通过对FSM的分析，揭示了r和d如何帮助维护记录查询时的层次结构，以及它们在查询引擎执行SQL类查询时的角色，包括过滤、投影和聚合操作。

摘要由CSDN通过智能技术生成

“神秘”的r和d

单从数据结构来看的话，我们可以这样解释r和d的含义。r代表着当前字段与前一字段的关系，是在哪一层合并的，即公共的父结点在哪？举例来说，假如我们重建到了Code='en'，通过r=2可以知道是在Language那一层发生了重复。

为了保持原纪录的结构，我们会保存一些NULL数据，而d就是用于重建NULL字段。通过d的值，就能知道NULL的结构。例如下图，通过r=1知道应该合并到Name那一层。而通过d=1则知道路径上只有一个字段，即不仅仅是Code字段不存在，Language也不存在。这样就把NULL正确地重建出来了，那么接下来的Code='en-gb'的层级也就不会乱了。

然而这只是从静态的数据结构来解释，而r和d的深层次含义还是要看FSM

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。