Apache Kylin使用心得

最新推荐文章于 2024-05-14 17:40:36 发布

jknn5046

最新推荐文章于 2024-05-14 17:40:36 发布

阅读量221

点赞数

本文链接：https://blog.csdn.net/jknn5046/article/details/104260436

版权

1.尽量使用Hive作为数据源，而不是Mysql，因为各种数据类型的支持相对更好一些，而且Build的效率也更高
2.时间类型如timestamp如果需要按天做聚合统计，在Kylin中创建Cube->Advanced Setting这一步中，将此列的类型选择为date而不是time，这样在写查询语句时更方便

3.将必然使用的维度加入Mandatory Dimensions，比如时间维度，在后续查询时总是将该维度加入查询语句
4.大概率会被同时查询的维度加入Joint Dimensions
5.不常用的维度都放入同一个Joint Dimension
6.可以将基数很小的几个维度设为一个Joint Dimension
7.将具有层次关系的维度放入Hierarchy Dimensions
8.可以从另一列中推断出的信息都设置为Derived，从而降低cuboid数量

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jknn5046

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Apache Kylin使用心得

1.尽量使用Hive作为数据源，而不是Mysql，因为各种数据类型的支持相对更好一些，而且Build的效率也更高2.时间类型如timestamp如果需要按天做聚合统计，在Kylin中创建Cube->Advanced Setting这一步中，将此列的类型选择为date而不是time，这样在写查询语句时更方便...
复制链接

扫一扫