1.要具有数据一致性,主键值必须是唯一的;Kylin 会进行检查,如果有两行的主键值相同则会报错。
2.维度表越小越好,因为 Kylin 会将维度表加载到内存中供查询;过大的表不适合作为维度表,默认的阈值是300MB。
3.改变频率低,Kylin 会在每次构建中试图重用维度表的快照,如果维度表经常改变的话,重用就会失效,这就会导致要经常对维度表创建快照。
4.维度表最好不要是 Hive 视图(View),虽然在 kylin 1.5.3加入了对维度表是视图这种情况的支持,但每次都需要将视图进行物化,从而导致额外的时间开销。