数仓建模—数据模型
前面我们讲了什么是数据仓库,以及数据仓库的发展历史,从这里开始我们讲解数仓建模,在开始之前我们先了解一下什么是数据模型,以及常见的数据模型都有哪些
数据建模的目标是说明系统内使用和存储的数据类型、这些数据类之间的关系、数据的分组和组织方式以及数据的格式和属性。
什么是数据模型
在详细探讨数据模型之前,我们需要明确什么是数据。从本质上讲,数据由收集、存储、分析和用于制定未来决策的事实、数字和统计数据组成。
在当今的数字世界中,我们不断生成大量此类数据 - 如果它要具有任何功能,就需要以有效的方式进行处理。这就是数据模型的用武之地。
数据模型是指用于组织和管理数据库或信息系统中的数据的数据结构的抽象表示。它定义了数据元素(代表现实世界的对象)之间的关系以及它们的组织、存储和检索方式。想象一下数据模型下的构建计划会很有帮助,整个系统将在此基础上构建。数据模型是根据业务需求构建的。规则和要求是根据业务利益相关者的反馈预先定义的,以便将其纳入新系统的设计中或在现有系统的迭代中进行调整。
数据可以在不同的抽象层次上建模。该过程首先从利益相关者和最终用户那里收集有关业务需求的信息。然后,这些业务规则被转换成数据结构,以制定具体的数据库设计。数据模型可以比作路线图、架构师的蓝图或任何有助于更深入地理解正在设计的内容的正式图表。
我们也可以理解为数据模型是现实世界或业务逻辑在数据层面的投影,是将数据元素以标准化的模式组织起来,用来模拟现实世界的信息框架和蓝图。数据模型用于创建数据库和数据仓库、管理数据以进行分析处