星型模型:所有的维度都能直接跟事实表关联,存在冗余数据,一般来说性能会更好。
雪花模型:一个或则多个维度表没有直接跟事实表关联,需要通过其他维度表才能关联到事实表,祛除了冗余数据,因为要跟维度表关联多次,所以效率不一定有星状模型好。
两种模型的优缺点:
星状模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花模型要高,星型机构不用考虑很多正规化的因素,设计与实现都比较简单;
雪花模型由于祛除了冗余,有些统计就需要表的联结才能产生,所以效率不一定有星状模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计,数据的etl,以及后期的维护
都要复杂一些,因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。