Kylin的入门学习

本文介绍了Kylin的基本架构、模型构建、Cube设计以及优化策略。重点探讨了Kylin的增量同步、维度组合以及如何通过排除不必要的计算来提升查询效率。同时提到了Kylin在处理层级维度和衍生维度时的优化技巧,并提供了Cube性能统计的相关命令。
摘要由CSDN通过智能技术生成

kylin的架构
在这里插入图片描述

基本操作 kylin
在这里插入图片描述
model
可能用到的维度 和可能用到的指标
在这里插入图片描述

Cube
业务中需要用到哪个指标 ,及哪个维度 有两个优化
在这里插入图片描述
优化的两部分
在这里插入图片描述
点击 这个才是正真执行
在这里插入图片描述

结果数据存储到哪个表
在这里插入图片描述

kylin适合星星模型

在这里插入图片描述
model可能用到的维度 和指标

在这里插入图片描述

cube 来源 sql ,sql根据业务
没有kylin需要计算 ,有kylin可以直接查询

kylin的底层原理 及优化

在这里插入图片描述

维度的组合 情况
n 代表维度的个数
2n次方 减 1  n

kylin中没有维度 也算一个维度 ,意思是说 没有group by 也算一种
在这里插入图片描述

一种可能称为 cubeid
在这里插入图片描述
所有的可能组合 cube
在这里插入图片描述

要么是维度 要么是指标

kylin的架构
在这里插入图片描述

kylin的增量
(增量的同步)
在这里插入图片描述

增量同步时 重新编译 ,修改下结束时间在这里插入图片描述

弊端
查询数据的速度太慢了
一个sessagement 对应hbase的一张表 ,同步一个增量数据就会 生成一个sessagement

在这里插入图片描述
在这里插入图片描述
合并

自动都需要 将cube设置为 无效
手动合并
时间 连续 ,运行期间不能删除数据 ,添加数据 ,修改 ,一个sessagement可以存储多天 也可以存储一天
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

sessagement再合并时 不许连续合并
(多个一天的合并 ,合并了一个多天的)
有层级关系时 最好是 倍数关系
在这里插入图片描述

删除
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

自动删除

设置保留的时间 ,过了保留的时间后自动删除
设置保留几天,设置保留的天数就会自动删除

在这里插入图片描述
在这里插入图片描述

用IDEA访问kylin时 只需要关注项目名

kylin Cube的优化
在这里插入图片描述

查新cubeid 有多少个的命令
bin /kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader cubeid名字
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

kylin优化有三种
1用不到的情况排除
2有层级的直接使用最后一层
3 不计算衍生维度的那种组合情况

kylin 维护 主键 和非主键 进行映射
原始的

衍生维度

衍生的维度排除计算 那种可能

在这里插入图片描述
第一种的结果
在这里插入图片描述

第二种
在这里插入图片描述
第二种的结果
在这里插入图片描述

分枝剪裁
123
聚合组
在这里插入图片描述

一种什么都不做
一种选着层级组合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值