《数据仓库工具箱》第一章笔记——数据仓库、商业智能及维度建模初步

第一章笔记——数据仓库、商业智能及维度建模初步

本章主要讨论下述概念:

  • DW/BI的业务驱动目标
  • 发布DW/BI系统的隐喻
  • 维度建模核心概念及涉及的主要词汇,包括事实表与维度表
  • Kimball DW/BI 架构组件与原则
  • 不同DW/BI架构的比较研究,维度建模在不同架构中所扮演的角色
  • 有关维度建模的误解

DW/BI的业务驱动目标

  1. DW/BI系统要能方便地存取信息。即简单、快捷。
  2. DW/BI系统必须以一致的形式展现信息。即字段定义而定唯一性,同名同义性,异名异义性。
  3. DW/BI系统必须能够适应变化。即拥抱因为业务需求所带来的变更。
  4. DW/BI系统必须是能及时展现信息。即时效性,数据随着时间的流逝,价值在不断的降低。
  5. DW/BI系统必须成为保护信息财富的安全堡垒。即权限控制,根据场景给予用户一定权限。
  6. DW/BI系统必须成为提供决策制定能力的权威和可信的基础。这样才能体现数据仓库的影响和价值。
  7. BW/BI系统成功的标志是业务群体接受DW/BI系统。没有人使用的系统,是无法进行迭代更新,其价值也是非常有限的。

尽管每一项都很重要,但最后两项是至关重要的。
第6点,决定项目地位,即所能获取的资源,对于项目开展有着决定性的影响。
第7点,决定项目上限,只有被业务系统所认可,广泛的使用,才能进行不断的迭代,项目才能越做越好。

发布DW/BI系统的隐喻

希望通过已存储的海量信息,来支持更多的基于事实的决策制定。

维度建模核心概念及涉及的主要词汇

维度建模:

  • 以商业用户可理解的方式发布数据。
  • 提供高效的查询性能——高性能查询的优化方法:预计算、索引策略。

业务数据标识为产品、市场、时间
从简单的数据模型开始是保持设计简单性的基础。
维度建模的核心原则之一是同一事实表中的所有度量行必须具有相同粒度。

事实表:
最实用的事实是数值类型和可加类型事实。
事实表的粒度可划分为三类:事务、周期性快照和累积快照。
事实表通常有包含外键集合的主键。事实表的主键常称为组合键。

维度表:
维度表用于描述与“谁、什么、哪里、何时、如何、为什么”有关的事情——5W1H。
数据仓库的好坏直接取决于维度属性的设置。
强大的维度属性带来的回报是健壮的分片-分块分析能力。
维度提供数据的入口点,提供所有DW/BI分析的最终标识和分组。

Kimball DW/BI 架构组件与原则

DW/BI环境分为4部分,分别为操作性源系统ETL系统数据展现商业智能应用

  1. 操作性源系统:获取业务事务。可以认为处于数据仓库之外。
  2. ETL系统:ETL,是Extract Transformation and Load缩写。包含一个工作区间,实例化的数据结构以及一个过程集合。最后是实际构建和加载数据到展现区域的目标维度模型中。
  3. 展现区:用于组织、存储数据,支持用户、报表制作者以及其他分析型商业智能(BI)应用的查询。展现区的数据必须是维度化的、原子(辅以增强性能的聚集)的、以业务过程为中心的。坚持使用总线结构的企业数据仓库。
  4. 商业智能应用:专用的查询工具,查询是使用数据提高决策能力的关键。

不同DW/BI架构的比较研究,维度建模在不同架构中所扮演的角色

  1. 独立数据集市架构:本身还是采用维度建模方式,但并不是建立企业级数据仓库,而是以部门需求为主,优点是能以低成本实现快速开发,缺点是从公司层面存在资源浪费,且从同一数据出发形成不同的解决方案,导致不协调。
  2. 辐射状企业信息工厂lnmon架构:比Kimball架构更加强调数据库的规范化,且用户可直接访问数据仓库。相当于形成大宽表,原子数据变得难以查询且会导致部门级的不兼容的数据集市发布到不同业务用户组。
  3. 混合辐射状架构与Kimball架构
    重点还是强调不要对原子级数据过分规范化,这层的数据处理代价很大。
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值