1.尽量使用Hive作为数据源,而不是Mysql,因为各种数据类型的支持相对更好一些,而且Build的效率也更高
2.时间类型如timestamp如果需要按天做聚合统计,在Kylin中创建Cube->Advanced Setting这一步中,将此列的类型选择为date而不是time,这样在写查询语句时更方便
3.将必然使用的维度加入Mandatory Dimensions,比如时间维度,在后续查询时总是将该维度加入查询语句
4.大概率会被同时查询的维度加入Joint Dimensions
5.不常用的维度都放入同一个Joint Dimension
6.可以将基数很小的几个维度设为一个Joint Dimension
7.将具有层次关系的维度放入Hierarchy Dimensions
8.可以从另一列中推断出的信息都设置为Derived,从而降低cuboid数量