《数据仓库》阅读笔记(二)

第7章 主管信息系统和数据仓库

7.1 EIS概述

主管信息系统(Executives Information System)是计算的最有效形式之一。通过EIS,高级管理分析人员可以精确指出问题并发现对于管理至关重要的趋势。
EIS处理是出于帮助主管指定决策而设计的。EIS的基本思想是提供信息,但不需要真正理解创建这些信息的基本结构。EIS的典型用途是:

  • 趋势分析和发现
  • 关键比例指标度量和跟踪
  • 向下钻取分析
  • 问题监控
  • 竞争分析
  • 关键性能指标监控

7.2 一个简单的例子

略~

7.3 向下钻取分析

向下钻取数据是指从一个汇总数据开始,将该汇总数据分解成一组更细致的汇总数据。通过获取汇总数据下的细节数据,管理者能够知道究竟正在发生什么事情,特别是汇总数据在哪里出现异常。
EIS另一个重要的功能是跟踪关键性能指标的能力。每个公司通过几个关键性能指标来反映公司某些方面的重要情况。

7.4 支持向下钻取

生成用于向下钻取的基本数据是成功执行向下钻取处理的主要障碍。这个问题之所以严重,是因为主管时而对这件事感兴趣,时而对那件事感兴趣,总是在改主意。每当新问题或者新机遇出现时,管理者的关注焦点就会改变。没有模式能预测管理者关注的下一个焦点是什么。

7.5 作为EIS基础的数据仓库

数据仓库在EIS环境中的操作效率是最高的。数据仓库是根据EIS分析员的需求定制的。
有了数据仓库,EIS分析员不必担心:

  • 搜索限定的数据源
  • 从现存系统中生成特定的抽程序
  • 处理非集成数据寻找合适的数据时基

简而言之,数据仓库提供了EIS分析员有效直吹EIS处理所必需的数据基础。

7.6 到哪里取数据

EIS分析员可能到个体处理层、部门(数据集市)处理层、轻度汇总处理层或档案数据层中去取数据。并且,EIS分析员为满足管理者的需要获取数据的过程,总是遵循一个标准的顺序或层次:
个体处理层->部门(数据集市)->轻度汇总数据->真实档案
采用这种顺序有很充分的理由。在从个体处理层专项档案层的过程中,分析员事实上进行了向下钻取分析。体系结构射界环境中汇总程度最高的数据出现在个体层。个体层的汇总支持层是部门层,支持部门层汇总的数据来自于轻度汇总层。最后轻度汇总层数据有档案层数据支持。

7.7 事件映射

EIS处理使用数据仓库逇一个有用的技术是事件映射。
收入趋势本身是令人感兴趣的,但它只是对公司运营情况的一个肤浅看法。要加强这种看法,要事件映射到趋势曲线上。

7.8 细节数据和EIS

需要多少细节数据才能运行EIS环境呢?一种学院派的说法是需要尽可能多的细节数据,通过存储尽可能多的数据,能做任何当前需要的分析工作。
这种看法是错误的,有几个原因:

  • 存储和处理的开销可能是天价
  • 大量数据是有效使用分析技术的一个障碍
  • 细节分析不可重用。如果新老分析的方式不完全相同,非常相似的分析还可能得到矛盾的结论。

7.9 在EIS中只保存汇总数据

但是,只保存汇总数据也会有一些问题:

  • 汇总数据蕴含着一个过程——汇总数据永远是计算过程的结果,任何情况下都不存在独立的汇总数据。如果EIS分析员不理解这个过程是与汇总数据密切相关的,分析结果可能会是误导性的。
  • 汇总数据不一定处于合适的粒度级。

第8章 外部数据与数据仓库

8.1 数据仓库中的外部数据

在数据仓库中,存在一些与外部数据的试用和存储相关的问题:

  • 外部数据存在的第一个问题是可用频率。与内部出现的数据不同,外部数据的呈现没有真正固定的模式。
  • 外部数据的第二问题是外部数据的形式是完全没有规则的
  • 外部数据的第三个问题是其不可预测型。外部去数据几乎叜任何是后续都可能来自于任何数据源。

8.2 元数据和外部数据源

元数据是至关重要的,因为在数据仓库环境中正是通过元数据来对外部数据进行注册、访问控制的的。元数据的典型内容就是元数据重要性的做好解释,例如:

  • 文件标识符(ID)
  • 进入数据仓库的日期
  • 文件描述
  • 文件来源
  • 文件分类

正是通过元数据,管理者可以判断许多有关外部数据的信息。在许多情况下,管理者甚至不看源文件,只看元数据。。因此,就外部数据而言,适当地建立和维护元数据对于数据仓库的操作是完全必要的。
与元数据相关的另一种数据类型是通知数据。当数据进入数据仓库和元数据时,要检查谁对该数据感兴趣。一旦发现获得的数据是某人感兴趣的,就向那个人发出通知。

8.3 存储外部数据

在许多情况下,将所有的外部数据存储在数据仓库中是不可能的也是不经济的。另一种方法是,在数据仓库的元数据中,对外部数据进行登记,创建一个条目说明什么地方能找到外部数据本身,而外部数据可以存储在任何一个方便的地方。

8.4 外部数据的不同部件

外部数据的重要设计问题之一是它经常包括许多不同的部件。为了管理这些数据,有经验的DSS分析员或工程师需要决定哪些数据单元是最重要的,然后将最重要的数据存储在一个联机的、容易访问的位置。这是第一个存储和访问效率的问题。其余不重要的细节不能丢弃,而是将其放在大容量存储设备中。

8.5 建模与外部数据

数据模型通常的作用是根据设计模型塑造环境。但外部数据是根本不可塑的。能做的最有用的事就是在相关的关键词和关键字解释范围内,记录数据模型和外部数据之间的区别。使用数据模型对外部数据进行任何重大改造都将是一个错误。

8.6 辅助报告

略~

8.7 外部数据存档

每一条信息(外部的或其他的)都有一个有用的声明周期。一旦潮吹了这个声明周期,保存这些信息就不经济了。通常,外部数据可能从数据仓库移出并放到较便宜的存储设备中。元数据对外部数据的引用应及时更新来反映新的存储位置,并且新的存储位置仍然保留在元数据存储单元中。

8.8 内部数据与外部数据的比较

外部数据最有用的一个功能是在一定时间范围内将其与内部数据进行比较。这种比较可以提供给管理者一个

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值