Apache Kylin 的工作流程是什么？

最新推荐文章于 2023-05-11 10:09:51 发布

Shockang

最新推荐文章于 2023-05-11 10:09:51 发布

阅读量3.1k

点赞数 8

分类专栏：大数据技术体系文章标签： kylin

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shockang/article/details/119900065

版权

大数据技术体系专栏收录该内容

282 篇文章 566 订阅

订阅专栏

前言

本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和文献引用请见1000个问题搞定大数据技术体系

正文

Apache Kylin 的工作原理就是对数据模型做 Cube 预计算，并利用计算的结果加速查询。

具体工作过程如下

在这里插入图片描述

指定数据模型，定义维度和度量。
预计算 Cube ，计算所有 Cuboid 并保存为物化视图。
执行查询时，读取 Cuboid ，运算，产生査询结果。

关于维度和度量请参考我的博客——什么是事实表和维度表？什么是维度和度量？

关于 Cube 和 Cuboid 请参考我的博客——Cube技术是什么？

由于 Kyin 的查询过程不会扫描原始记录，而是通过预计算预先完成表的关联、聚合等复杂运算，并利用预计算的结果来执行査询，因此相比非预计算的查询技术，其速度一般要快一到两个数量级，并且这点在超大的数据集上优势更明显。

当数据集达到千亿乃至万亿级别时， Kylin 的速度甚至可以超越其他非预计算技术 1000 倍以上。

关注

8
点赞
踩
7

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。