数据仓库与数据挖掘的第三章课后习题

第三章习题

1.SQL Server SSAS提供了所有业务数据的统一整合视图,可以作为传统报表、  在线分析处理(OLAP)分析、关键性能指示器记分卡和数据挖掘的基础。

2.数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分(包括 名称、维度类别、层次和 度量)全面地描述出来。

3.数据仓库的逻辑模型通常釆用星型图法来进行设计,要求将星型图的各类逻辑实体完整地描述出来。

4.按照事实表中度量的可加性情况,可以把事实表对应的事实分为4种类型: 事务事实快照事实线性项目事实和事件事实。

5.确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据用户需求设计聚合

6.在项目实施时,根据事实表的特点和用户的查询需求,可以选用时间、业务类 型、区域和下属组织等多种数据分割类型。

7.当维表中的主键在事实表中没有与外键关联时,这样的维称为退化维。它与事实表并无关系,但有时在査询限制条件(如订单号码、出货单编号等)中需要用到。

8. 维度可以根据其变化快慢分为无变化维度、缓慢变化维度和剧烈变化维度三类。

9.数据仓库的数据量通常较大,旦数据一般很少更新,可以通过设计和优化索引结构来提高数据存取性能。

10.数据仓库数据库常见的存储优化方法包括表的归并与簇文件、反向规范化,引入冗余、表的物理 分割(分区)。

11.什么是信息包图法?它为什么适用于数据仓库的概念模型的设计?

答:信息包图法,也叫用户信息需求表,就是在一张平面表格上描述元素的多维性,其中的每一个维度用平面表格的一列表示,通常的维度如时间、地点、产品和顾客等;而细化本列的对象就是类别,例如时间维度的类别可以细化到年、月、日,甚至小时;平面表格的最后一行(代表超立方体中的单元格)即为指标度量值,例如,某年在某销售点的某类产品的实际销售额。创建信息包图时需要确定最高层和最低层的信息需求,以便最终设计出包含各个层次需要的数据仓库 总之,信息包图法是一种自上而下的数据建模方法,即从用户的观点开始设计(用户的观点是通过与用户交流得到的),站在管理者的角度把焦点集中在企业的一个或几个主题上,着重分析主题所涉及数据的多维特性,这种自上而下的方法几乎考虑了所有的信息源,以及这些信息源影响业务活动的方式。

12.简述数据仓库系统设计过程。

答:收集、分析和确认业务分析需求,分析和理解主题和元数据、事实及其量度、粒度和维度的选择与设计、数据仓库的物理存储方式的设计等。

13.一个数据仓库系统的建立通常需要经过哪些步骤?

答:(1)收集和分析业务需求; (2)建立数据模型和数据仓库的物理设计; (3)定义数据源; (4)选择数据仓库技术和平台; (5)从操作型数据库中抽取、清洗及转换数据到数据仓库; (6)选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件; (7)更新数据仓库。

14.运行SQL Server的Adventure Works DW示例数据库,建立多维数据模型练习。

答:参考 3.3 节的过程。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值