本文章将介绍如何创建kylin的cube,首先准备hive的表及数据。在创建cube之前先介绍下kylin的几个概念:project、model、cube,刚开始接触的时候,这些概念很容易弄混。
1. project,项目名称,经常以hive的数据库的名字命名,下面可以有很多model。
2. model,hive数据库下某些表之间的关联关系,即数据模型,也可以是这个数据库下所有表之间的关联关系。
3. cube,在model的基础上做最大化的预计算,并把预计算的结果存放于hbase,此为cube。每个model对应一个cube。
4. Dimensions,维度,可以自行选择每个表的维度,可以认为就是关联后整个大表的字段吧
5. Measures,根据维度的不同,可以采用不同的度量计算:SUM、MAX、MIN、COUNT和COUNT_DISTINCT等
一、建project
点击“+”按钮,输入project名称即可。这里新建的project 叫 jira2
二、加载数据源表
建model之前需要为project引入数据源
选择项目 --> model --> data source --> 加载数据
可以手动输入,也可以从kylin自动识别到的hive表中点击选择
三、建model
models --> new --> new model --> 输入model name--> 选择事实表 --> 增加维度表
选择维度列
后面的measures、settings默认即可
最后点击保存
四、创建cube模型
选择维度
这里我选择了所有的维度表的维度。
选择度量,选择了事实表的ID用来计算count_distinct
后面一些设置根据自己情况而定,我都保持默认。
五、cube生成
点击build后即可将cube的预计算结果保存在hbase
查看监控创建完成
接下来就可以做查询了。。。。