数据仓库星型模型和雪花模型的区别

数据仓库星型模型和雪花模型的区别

现在数据仓库相关的知识点中,星型模型和雪花模型是常见的问题

1概述
数据冗余是指同一条数据存储在不同的数据文件中都进行存储,从而产生冗余数据的现象
2星型模型和雪花模型

​ 数据仓库主要关注数据和数据之间的业务含义,我们在对数据分析的过程中,为了保证数据的有效性和准确性,必须对数据进行分析以及对数据的分析口径进行细化,精确的定位数据的影响因素,维度表就是定义分析角度的一种方式。

​ 根据事实表和维度表之间的关系,我们将常见的模型分为星型模型和雪花模型。

星型模型:当所有的维度表都是和事实表直接相连的时候,整个图形看上去就像是一个星星,我们称之为星型模型。星型模型是一种非正规化的架构,因为多维数据集的每一个维度都和事实表直接相连,不存在渐变维度,所以有一定的数据冗余,因为有数据的冗余,很多的统计情况下,不需要和外表关联进行查询和数据分析,因此效率相对较高。
在这里插入图片描述

​ 星型模型示意

雪花模型:当有多个维度表没有直接和事实表相连,而是通过其它的维度表,间接的连接在事实表上,其图形就像是一个雪花,因此我们称之为雪花模型,雪花模型的优点是减少了数据冗余,在办进行数据统计或分析的时候,需要和其他的表进行关联。

在这里插入图片描述

​ 雪花模型示意

星型模型和雪花模型最根本的区别就是,维度表是直接连接到事实表还是其他的维度表。

雪花模型的优点: 通过最大限度的减少数据量以及连接较小的维度表来实现改善查询的功能,雪花结构减少的数据的冗余。

雪花模型缺点:在雪花模型需要事实表和维度表之间的连接较多,因此查询性能会相对较低

型需要事实表和维度表之间的连接较多,因此查询性能会相对较低

适用情况:星型模型更适用于做指标分析,而雪花模型更适用于做维度分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值