浅谈数据模型

1:事实表和维表的概述

前言:数据仓库是一种用于存储和管理大量数据的技术。其中,事实表和维表是数据仓库中的两个重要概念,首先了解一下事实表和维度表

1.事实表:是指用于存储测量“事实数据”的表,事实数据表包含描述业务(例如产品销售)内特定事件的数据,例如订单信息表、销售记录表等

2.维表是用于提供事实表上下文和维度信息的表,例如时间表、地区表、客户表等

事实表通常包含多个维表,这些维表提供了与事实数据相关的上下文和维度信息,维表通常与事实表相关联,以提供关于数据测量的上下文和描述信息。

以上总结:

1.事实表存储的是度量值,也可以是计算值,是一条一条的明细,可分为周期快照事实表(按一定的周期业务积累的数据)和累计快照事实表(记录整个过程的数据)

2.维度表:由上图可看,维度表一般都是每条数据都是唯一的,有主键设置,它的主键是事实表的外键。可细分一般维度表(数据是不断增加和变化的)和固定维度表(数据是不变的,例如码值表)

2.数据模型

数据模型一般分为:星型模型、雪花模型、星型-雪花模型、事实星座模型

一、星型模型

星型模型是由一个事实表和多个维度表组成的一种体系结构。事实表位于星型模型的中心,维度表则呈辐射状与事实表相连,各种维度表之间不存在联系。这种模型的结构简单,易于理解和实现。此外,星型模型还具有较好的查询性能和可扩展性,因此在数据仓库的构建中被广泛采用。

二、雪花模型

雪花模型是由1个事实表和多个维度表组成的一种体系结构。维度表和维表相连,再连接到事实表,形成一个复杂的网状结构。与星型模型相比,雪花模型的结构更加灵活,能够更好地支持复杂的数据分析需求。然而,这种模型的构建和维护较为困难,且查询性能相对较低。

三、事实星座模型

事实星座模型是由多个事实表和多个维度表组成的一种体系结构。与雪花模型不同的是,事实星座模型的事实表之间不再直接相连,而是通过维度表相连形成一个星座状结构。这种模型的结构非常灵活,能够更好地支持复杂的数据分析需求。然而,这种模型的构建和维护非常困难,需要谨慎使用。

3.维度建模四个步骤

1.选择业务过程
表示的是业务执行的活动,产生一系列事实表。
2.声明粒度
粒度是事实表的度量细节级别。通常从原子级别粒度开始设计,这样可以支持上卷,也支持下钻细节,能够承受各种用户查询。
3.确认维度
文本属性,用来修饰事实表。
4.确认事实
是维度建模的核心。
不同粒度的度量要放在不同的事实表中。
通过外键关联相关维度。
查询操作是基于事实表开展计算和聚合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值