Kylin设计详解二

最新推荐文章于 2024-06-23 10:09:46 发布

‘禹’你一起

最新推荐文章于 2024-06-23 10:09:46 发布

阅读量217

点赞数

文章标签： kylin big data 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangzty111/article/details/125325129

版权

本文详细介绍了Kylin Cube的构建及优化过程，包括7个步骤的构建阶段和优化阶段，涉及到Cube基本信息设置、维度和指标选择、存储优化等关键环节。重点讲解了COUNT_DISTINCT的精确与模糊计算、TOP_N优化以及PERCENTILE分位数计算，同时提到了自动合并Segments和生命周期管理对查询效率的影响。

摘要由CSDN通过智能技术生成

目录

4 Cube构建及优化

4.1 Cube构建及优化总览

4.2 Cube构建分步骤说明

4 Cube构建及优化

4.1 Cube构建及优化总览

构建Cube的过程设计可以说是 kylin 系统设计的精华，这7个步骤封装了 kylin 绝大多数的实现细节，呈现出来的是简洁精炼的构建步骤。

上图中，有7个步骤，可以分为三个阶段：前四步为构建阶段，5、6步为优化阶段，最后一步为总览。下面我们一个一个详细说一下

4.2 Cube构建分步骤说明

在这一步中，我们需要设置的是 Cube 的基本信息，其中包括：

Model Name：model 名。

Cube Name： Cube 名，全局唯一，否则会创建失败。

Notification Email List：发生了 Notification Events 时要通知的邮件列表，逗号分隔。

Notification Events：发生什么事件时要邮件通知列表中的用户，分为 Success（构建成功）、Error（构建失败）、Discard（构建中止）。

Description：描述。

设置 Cube 所需的维度，查找表中的维度可以设置为 normal 或 derived，设置为 derived 的维度不会在 rowkey 中出现，而是用其他 normal 维度通过一层映射得到。

最低0.47元/天解锁文章

‘禹’你一起

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。