Kylin的入门学习

最新推荐文章于 2022-05-11 10:53:48 发布

牛犊6

最新推荐文章于 2022-05-11 10:53:48 发布

阅读量204

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45793819/article/details/107443002

版权

本文介绍了Kylin的基本架构、模型构建、Cube设计以及优化策略。重点探讨了Kylin的增量同步、维度组合以及如何通过排除不必要的计算来提升查询效率。同时提到了Kylin在处理层级维度和衍生维度时的优化技巧，并提供了Cube性能统计的相关命令。

摘要由CSDN通过智能技术生成

kylin的架构
在这里插入图片描述

基本操作 kylin
在这里插入图片描述
model
可能用到的维度和可能用到的指标

Cube
业务中需要用到哪个指标，及哪个维度有两个优化
在这里插入图片描述
优化的两部分

点击这个才是正真执行

结果数据存储到哪个表
在这里插入图片描述

kylin适合星星模型

在这里插入图片描述
model可能用到的维度和指标

在这里插入图片描述

cube 来源 sql ，sql根据业务
没有kylin需要计算，有kylin可以直接查询

kylin的底层原理及优化

在这里插入图片描述

维度的组合情况
n 代表维度的个数
2n次方减 1 n

kylin中没有维度也算一个维度，意思是说没有group by 也算一种
在这里插入图片描述

一种可能称为 cubeid
在这里插入图片描述
所有的可能组合 cube

要么是维度要么是指标

kylin的架构
在这里插入图片描述

kylin的增量
（增量的同步）
在这里插入图片描述

增量同步时重新编译，修改下结束时间在这里插入图片描述

弊端
查询数据的速度太慢了
一个sessagement 对应hbase的一张表，同步一个增量数据就会生成一个sessagement

在这里插入图片描述

合并

自动都需要将cube设置为无效
手动合并
时间连续，运行期间不能删除数据，添加数据，修改，一个sessagement可以存储多天也可以存储一天
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

sessagement再合并时不许连续合并
（多个一天的合并，合并了一个多天的）
有层级关系时最好是倍数关系
在这里插入图片描述

删除
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

自动删除

设置保留的时间，过了保留的时间后自动删除
设置保留几天，设置保留的天数就会自动删除

在这里插入图片描述

用IDEA访问kylin时只需要关注项目名

kylin Cube的优化
在这里插入图片描述

查新cubeid 有多少个的命令
bin /kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader cubeid名字
在这里插入图片描述

kylin优化有三种
1用不到的情况排除
2有层级的直接使用最后一层
3 不计算衍生维度的那种组合情况

kylin 维护主键和非主键进行映射
原始的

衍生维度

衍生的维度排除计算那种可能

在这里插入图片描述
第一种的结果

第二种
在这里插入图片描述
第二种的结果

分枝剪裁
123
聚合组
在这里插入图片描述

一种什么都不做
一种选着层级组合

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。