事务型数据库虽然非常适合日常运营,但并不适合分析数据以发现有助于业务增长的趋势和见解。这就是数据仓库的作用所在。数据仓库是一个单独的数据库,经过优化,可用于存储大量历史数据以及快速查询和分析。
挑战在于如何构建仓库中的数据,以便进行高效分析,同时保持足够的灵活性以应对不断变化的业务需求。数据仓库中的数据建模有几种常见和不太常见的方法。在本文中,我们将介绍七种关键的建模技术,权衡它们的优缺点,并帮助您为数据仓库选择正确的方法。
一、事务数据库示例
在深入研究数据仓库建模之前,让我们简单看一下餐厅的典型事务数据库可能包含哪些内容:
- 包含姓名、电子邮件、电话号码等详细信息的客户表
- 预订表,包括预订日期、时间、团体规模等
- 带有描述的产品表,链接到产品价格和产品组表
- 订单表将顾客与他们所选的菜单项联系起来
- 订单明细表,其中包含每个订单的每个菜单项的数量
- 包含总额、付款方式等的付款表。
交易数据库使用针对处理交易进行优化的规范化结构。但这种结构使分析和报告更加困难。数据仓库建模方法对数据进行非规范化和重组,以优化整合层中的分析,同时仍便于快速写入加工层。
二、数据仓库建模方法
1.第三范式(3NF)
第三范式 (3NF) 是一种经典的关系数据库建模方法,可最大限度地减少数据冗余。在 3NF 中ÿ