kylin面试

最新推荐文章于 2021-08-12 21:41:01 发布

人间向阳木

最新推荐文章于 2021-08-12 21:41:01 发布

阅读量284

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39660507/article/details/109437200

版权

kylin的核心的概念及特点
是一个多维分析引擎
它的建模思想始终贯穿“维度建模思想：星型思想（雪花模型）”
它的查询速度之所以很快因为他是预计算的
预计算的引擎：可以是MR，可以是spark，也可以是flink

预计算是什么？
预计算多维数据立方体cube（类似于hivesql中的whit cube 得到的结果）

如果模型的维度高达几十个，则cube的计算量和结果的数据量都会爆表，怎么办：
设计好恰当的维度剪枝方案

维度剪枝优化方案有哪些？
利用衍生纬度（定义为衍生纬度的纬度不参与计算）
利用聚合组（大量消除组间纬度组合）
利用聚合组内的减枝维度手段：必选维度，层级维度，联合维度

kylin预计算产生的结果cube存放在哪里？
hbase，每一个segment存储为一个表
cube产生的表可以自动或者手动合并

cube在hbase中存储的表中的rowkey是怎么组成的？
以各纬度（通过一定的优化编码技术）拼接而成

什么叫cuboid？
一种维度组合计算的结果叫cuboid,
所有维度组合计算的结果为base cuboid
各种N维cuboid都是base cuboid逐级聚合运算产生的

什么叫全量构建？

针对数据源所有数据进行cube计算，就是全量构建

什么叫做增量构建？什么叫做segment？
针对数据源表的一个分区或者某一段进行cube计算，就是增量构建，
对于此次产生构建的结果就是segment

怎么样实现自动增量构建?
通过curl 命令调用 kylin的 restapi接口实现构建增量表，然后将命令编写成shell脚本，放入azkaban中调度，就可以自动构建增量表。

怎样实现在自己的web系统中查询kylin 的数据？
通过jdbc连接kylin 使用sql查询

人间向阳木

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
kylin面试

kylin的核心的概念及特点是一个多维分析引擎它的建模思想始终贯穿“维度建模思想：星型思想（雪花模型）”它的查询速度之所以很快因为他是预计算的预计算的引擎：可以是MR，可以是spark，也可以是flink预计算是什么？预计算多维数据立方体cube（类似于hivesql中的whit cube 得到的结果）如果模型的维度高达几十个，则cube的计算量和结果的数据量都会爆表，怎么办：设计好恰当的维度剪枝方案维度剪枝优化方案有哪些？利用衍生纬度（定义为衍生纬度的纬度不参与计算）利用聚合组（大量
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。