数据模型设计(数仓方法论)
3.1、维度建模
-
- 精通星型模型(Star Schema)和雪花模型(Snowflake Schema)的设计原理和应用场景。
- 能够根据业务需求和查询性能要求设计合适的维度模型和事实表。
- 熟悉缓慢变化维度(Slowly Changing Dimensions, SCD)的处理策略。
维度建模的三种模型 Kimball方法论提出了维度建模方法,将表分为事实表和维度表,以优化查询性能并提高最终用户访问数据的便利性。 Inmon方法论则是一种自上而下的数据仓库设计方法,强调数据仓库的规范性、一致性、整合性,以确保数据的准确性、可信度。 维度建模是一种在数据仓库中用于数据建模的技术,它将 事实表 和 维度表 组织在一起,以提供快速、简单的数据分析功能。 在维度建模中,事实表:度量指标,维度表:维度属性。常见的维度建模有星型模型、雪花模型和星座模型。 星型模型 和 雪花模型 被 Kimball(肯啵)方法论 采用,都强调数据的查询性能和分析需求,注重数据仓库的灵活性和可扩展性。 三范式(3NF)被Inmon(移门)方法论采用,都强调数据的一致性、完整性和准确性,注重数据仓库的基础架构建设和数据管理。 |
1】、星型模型【Kimball方法论】
是最简单和常用的模型,它以一个事实表为中心,周围连接着多个维度表。事实表包含主要的业务数据,而维度表则用于描述事实表中的数据。 但由于其结构简单明了,查询效率较高,因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率。 简单说:它以一个事实表为中心,周围连接着多个维度表。事实表包含度量值,而维度表则用于描述事实的各个方面。 ★优点: 简单易理解、易于查询和数据仓库的高性能,良好的数据完整性和灵活性,可以轻松地添加或删除维度属性。 ★缺点: 处理大规模、复杂数据时可能会出现瓶颈,而且它可能会消耗较多的存储空间和带宽,时效性跟不上。 |
2】、雪花模型
雪花模型是对星型模型的扩展, |