数据仓库之星型模型

最新推荐文章于 2024-07-20 11:32:17 发布

james二次元

最新推荐文章于 2024-07-20 11:32:17 发布

阅读量796

点赞数 5

分类专栏：数据仓库文章标签：大数据数据仓库

本文链接：https://blog.csdn.net/youziguo/article/details/139499700

版权

23 篇文章 0 订阅

订阅专栏

星型模型（Star Schema）是一种常见的数据仓库建模技术，专门用于支持高效的查询和数据分析。它以其简单直观的结构得名，中心是一个事实表（Fact Table），周围是多个维度表（Dimension Tables），整体结构看起来像一颗星。

事实表（Fact Table）
- 定义：存储与业务过程相关的数值型度量数据（Measures），如销售额、数量等。
- 特征：
  - 主键：由多个外键组成，这些外键引用相关的维度表。
  - 度量：通常是数值型数据，可以进行聚合操作（如求和、平均）。
  - 记录数：通常非常庞大，因为每条记录代表一个业务事务或事件。
- 示例：销售事实表，包含销售金额、销售数量、时间键、产品键、客户键等字段。
维度表（Dimension Tables）
- 定义：存储业务过程中描述性的信息，为事实表中的度量提供上下文。
- 特征：
  - 主键：单一的主键列，通常是业务主键或代理键（Surrogate Key）。
  - 属性：维度表包含多个属性，用于描述维度的特性。
  - 记录数：相对较少，通常远小于事实表。
- 示例：时间维度表（包含年、季度、月、日等属性）、产品维度表（包含产品ID、产品名称、类别、品牌等属性）、客户维度表（包含客户ID、客户姓名、地址、联系方式等属性）。

假设我们有一个销售数据仓库，以下是可能的星型模型示例：

时间键（Time Key）	产品键（Product Key）	客户键（Customer Key）	销售金额（Sales Amount）	销售数量（Sales Quantity）
20220101	1001	5001	1000.00	10
20220101	1002	5002	1500.00	15
...	...	...	...	...

时间键（Time Key）	年（Year）	季度（Quarter）	月（Month）	日（Day）
20220101	2022	Q1	1	1
20220102	2022	Q1	1	2
...	...	...	...	...

产品键（Product Key）	产品名称（Product Name）	类别（Category）	品牌（Brand）
1001	产品A	电子产品	品牌X
1002	产品B	家居用品	品牌Y
...	...	...	...

客户键（Customer Key）	客户姓名（Customer Name）	地址（Address）	联系方式（Contact Info）
5001	客户甲	地址A	联系方式A
5002	客户乙	地址B	联系方式B
...	...	...	...

通过上述步骤，可以构建一个有效的星型模型数据仓库，支持复杂的数据分析和业务决策。

关注