写在前面:
又来写废话了,草稿箱里放了大半年了,今天写完它。相关资料很多,官方对cube构建过程的解释如下链接:
https://kylin.apache.org/cn/docs/howto/howto_optimize_build.html
自己写一遍能够避免浮躁,走马观花式的学习。
Cuboid的读音:[ˈkjuːbɔɪd]
==================================
kylin在hive中会使用一个叫做kylindb的库
Step #1: Create Intermediate Flat Hive Table
做表关联,做一张关联后的宽表,具体步骤如下:
1.1 根据cube的维度、度量创建中间宽表 kylin_intermediate_cubeA。
DROP TABLE IF EXISTS kylin_intermediate_cubeA;
CREATE EXTERNAL TABLE IF NOT EXISTS kylin_intermediate_cubeA
(
...
)STORED AS SEQUENCEFILE
LOCATION 'hdfs://reh/kylin/kylin_metadata/kylin-.../kylin_intermediate_cubeA';
1.2 设置中间表属性,删除或覆盖数据时不经过回收站