Mastering Data Warehouse Design
数据仓库设计
【原 书 名】 Mastering Data Warehouse Design:Relational and Dimensional Techniques
【原出版社】 John Wiley & sons,Inc.
【作 者】(美)Claudia Imhoff,Nicholas Galemmo,Jonathan G.Geiger
【丛 书 名】 数据库技术丛书
【出 版 社】 机械工业出版社 【书 号】 7111139631
【出版日期】 2004 年12月 【开 本】 16开 【页 码】 312 【版 次】1-1
说明:
中文书缺货,也没有电子版下载,只下到英文版。决定读英文原著,并同时把它翻译过来。贴到这里,请各位多多指教。
【内容简介】
大多数数据仓库的管理者、设计者和开发者都熟悉Ralph Kimball在2001年写给数据仓库界的那封公开信。在信中,他向Inmon阵营提出了挑战,要求回答关于关系式方法有效性的棘手问题。由最著名的Inmon方法专家--Claudia Imhoff和其他作者合写的这本书,正面回答了Kimball公开信中提出的挑战性问题,并为在复杂的业务智能环境中如何正确地应用关系式和多维式两种建模技术提供了指导。
主要内容如下:
●在已经囊括了所有行业的各种公司的数据仓库环境中,已知哪种方法是最成功的
●给出了关系方法和多维方法的正反两方面意见对比,开发者可以确定最适合的方法
●为什么体系结构应该包括建立在关系数据模型概念之上的数据仓库
●键的构造和使用,数据仓库、层次及事务型数据的历史性质
●为了保证数据仓库能满足较好的性能要求,所需要解决的技术问题
●为保证最优数据仓库性能和处理随时间变化的数据,所需要的关系建模技术
本书全面论述了设计和建立高效、可持续发展且可扩展的数据仓库的方法,重点论述了建立各种数据模型的方法。主要内容包括业务智能环境和数据模型的概念、数据模型分类、数据模型的开发步骤、各种数据的建模方法、数据仓库的优化与扩展、数据模型的维护、关系型解决方案的部署、多维体系结构与企业信息工厂的比较等。
本书主要面向数据仓库的设计者和构建者以及数据仓库技术研究人员,同时也适合对数据仓库技术和企业信息化建设感兴趣的其他读者阅读。
译者序
第一部分 基本概念
第1章 绪论
1.1 业务智能概述
1.2 什么是数据仓库
1.2.1 数据仓库的作用和用途
1.2.2 企业信息工厂
1.3 数据仓库的多用途性
1.3.1 支持的数据集市类型
1.3.2 支持的BI技术类型
1.4 可维护的数据仓库环境的特点
1.5 数据仓库数据模型
1.5.1 非冗余性
1.5.2 稳定性
1.5.3 一致性
1.5.4 最终数据使用方面的灵活性
1.5.5 Codd和Date前提
1.6 建立数据集市的效果
1.7 小结
第2章 关系的基本概念
2.1 为什么需要数据模型
2.2 关系数据模型的建模对象
2.2.1 主题
2.2.2 实体
2.2.3 元素或属性
2.2.4 联系
2.3 数据模型的类型
2.3.1 主题域模型
2.3.2 业务数据模型
2.3.3 系统模型
2.3.4 技术模型
2.4 关系数据建模指南
2.4.1 指导方针与最合适的做法
2.4.2 规范化
2.5 关系数据模型的规范化
2.5.1 第1范式
2.5.2 第2范式
2.5.3 第3范式
2.5.4 其他规范化级别
2.6 小结
第二部分 模型开发
第3章 理解业务模型
3.1 业务场景
3.2 主题域模型
3.2.1 关于特定行业的考虑
3.2.2 主题域模型开发过程
3.2.3 Zenith汽车公司的主题域模型
3.3 业务数据模型
3.4 小结
第4章 模型开发
4.1 方法学
4.1.1 步骤1:选择感兴趣的数据
4.1.2 步骤2:在键中增加时间
4.1.3 步骤3:增加派生数据
4.1.4 步骤4:确定粒度级别
4.1.5 步骤5:汇总数据
4.1.6 步骤6:合并实体
4.1.7 步骤7:建立数组
4.1.8 步骤8:分离数据
4.2 小结
第5章 键的建立和维护
5.1 业务背景
5.1.1 不一致的客户业务定义
5.1.2 不一致的客户系统定义
5.1.3 系统之间不一致的客户标识
5.1.4 包含外部数据
5.1.5 由角色唯一确定的客户
5.1.6 未加说明的客户层次结构
5.2 数据仓库系统模型
5.2.1 不一致的客户业务定义
5.2.2 不一致的客户系统定义
5.2.3 系统之间不一致的客户标识
5.2.4 吸收外部数据
5.2.5 由角色唯一确定的客户
5.2.6 未加说明的客户层次结构
5.3 数据仓库技术模型
5.3.1 来自现存系统的键
5.3.2 来自公认标准的键
5.3.3 代理键
5.4 多维数据集市的含义
5.4.1 多维模型中的差异
5.4.2 多维一致性的维护
5.5 小结
第6章 日历建模
6.1 业务中的日历
6.1.1 日历类型
6.1.2 其他财务日历
6.1.3 日历的元素
6.1.4 日历时间跨度
6.2 时间和数据仓库
6.2.1 时间的性质
6.2.2 时间的标准化
6.3 数据仓库系统模型
6.4 案例分析:简单财务日历
6.4.1 分析
6.4.2 一个简单日历模型
6.5 案例分析:位置有关日历
6.5.1 分析
6.5.2 GOSH日历模型
6.5.3 日历交付
6.6 案例分析:多语种日历
6.6.1 分析
6.6.2 多国语言的存储
6.6.3 不同日期表示格式的处理
6.6.4 多语种交付
6.7 案例分析:多重财务日历
6.7.1 分析
6.7.2 扩展日历
6.8 案例分析:季节日历
6.8.1 分析
6.8.2 季节日历的结构
6.8.3 季节数据交付
6.9 小结
第7章 层次树建模
7.1 业务中的层次树
7.2 层次树的性质
7.2.1 层次树的深度
7.2.2 层次树的父子关系
7.2.3 层次树的结构
7.2.4 历史
7.2.5 层次树类型小结
7.3 案例分析:零售层次树
7.3.1 层次树的分析
7.3.2 层次树的实现
7.4 案例分析:销售和产量计划安排
7.4.1 分析
7.4.2 产品层次树
7.4.3 客户层次树
7.5 案例分析:零售采购
7.5.1 分析
7.5.2 业务模型的实现
7.6 案例分析:套装
7.6.1 分析
7.6.2 材料清单的加入
7.6.3 数据的发布
7.7 结构的变换
7.7.1 递归树的构建
7.7.2 递归树的平面化
7.8 小结
第8章 事务建模
8.1 业务型事务
8.1.1 数据仓库的业务应用
8.1.2 每个事务的平均行数
8.1.3 涉及变化的业务规则
8.2 应用接口
8.2.1 快照接口
8.2.2 增量接口
8.2.3 数据库事务日志
8.3 事务数据的交付
8.4 案例分析:销售订单快照
8.4.1 订单的变换
8.4.2 技术1:完全快照捕捉
8.4.3 技术2:变化快照捕捉
8.4.4 技术3:具有增量捕捉的变化快照
8.4.5 装载处理
8.5 案例分析:事务接口
8.5.1 事务的建模
8.5.2 事务的处理
8.6 小结
第9章 数据仓库优化
9.1 开发过程的优化
9.1.1 设计和分析的优化
9.1.2 应用开发的优化
9.2 数据库的优化
9.2.1 数据聚簇
9.2.2 表划分
9.2.3 实施参照完整性
9.2.4 按索引组织的表
9.2.5 索引技术
9.2.6 小结
9.3 系统模型的优化
9.3.1 垂直划分
9.3.2 逆规范化
9.3.3 子类型聚簇
9.4 小结
第三部分 操作和管理
第10章 对业务变化的适应
10.1 数据仓库的变化
10.1.1 变化的缘由
10.1.2 对变化的控制
10.1.3 变化的实现
10.2 业务变化的建模
10.2.1 设想最坏的情况
10.2.2 对联系的概化
10.2.3 使用代理键
10.3 业务变化的实现
10.3.1 主题域的集成
10.3.2 增加主题域
10.4 小结
第11章 模型维护
11.1 模型及其演进的管理
11. 1.1 主题域模型
11.1.2 业务数据模型
11.1.3 系统数据模型
11.1.4 技术数据模型
11.1.5 同步的含义
11.2 模型的协调
11.2.1 主题域和业务数据模型
11.2.2 业务数据模型和系统数据模型
11.2.3 系统数据模型和技术数据模型
11.3 对多个建模师的管理
11.3.1 作用和职责
11.3.2 冲突管理
11.4 小结
第12章 关系型解决方案的部署
12.1 数据集市的混乱
12.1.1 为什么糟糕
12.1.2 "体系结构方式"准则
12.2 从数据集市混乱结构中迁移出来
12.2.1 维的一致化
12.2.2 建立数据仓库数据模型
12.2.3 建立数据仓库
12.2.4 仅仅以"体系结构方式"建立新的数据集市--不理会旧的集市
12.2.5 从一个数据集市建立体系结构
12.3 选择正确的迁移路径
12.4 小结
第13章 数据仓库设计方法学比较
13.1 多维体系结构
13.2 企业信息工厂体系结构
13.3 CIF体系结构和MD体系结构的比较
13.3.1 范围
13.3.2 角度
13.3.3 数据流
13.3.4 易失性
13.3.5 灵活性
13.3.6 复杂性
13.3.7 功能性
13.3.8 持续的维护
13.4 小结
术语表
参考文献
作者介绍:
Claudia Imhoff, Ph.D,Intelligent Solutions公司(www.IntelSols.com)的总裁和创始人,CRM及BI的首席顾问。在很多企业,大学及技术公司,她是一个受欢迎的演说家和国际知名专家,在该领域,她与人合作出版了5本专著及 50篇论文。
Nicholas Galemmo 美国雀巢公司的信息系统架构师,在制造业,商品流通,教育,军事,卫生保健,金融行业的应用系统设计和开发领域有27年的经验,有11年参与大型数据仓库和系统集成项目经验,使用维度和关系架构建立了很多数据仓库,发表了很多论文,参加过国家级学术会议。这是他的第一本书。
Jonathan G. Geiger 是Intelligent Solutions公司的执行副总裁,在公用事业,电信,制造业,教育,化学,金融,零售等行业参与企业信息公司(CIF)及客户关系管理(CRM)项目的开发。在30年的实践及咨询从业生涯中,涉及到信息管理的各个方面,独自出版或与人合作出版了2本书及30多篇论文,经常出席国际及国际学术会议,并在几个研讨会上讲授。
Claudia Imhoff, Ph.D. is the president and founder of Intelligent Solutions (www.IntelSols.com), a leading consultancy on CRM (Customer Relationship Management) and business intelligence technologies and strategies. She is a popular speaker and internationally recognized expert and serves as an advisor to many corporations, universities, and leading technology companies on
these topics. She has coauthored five books and over 50 articles on these topics. She can be reached at CImhoff@IntelSols.com.
Nicholas Galemmo was an information architect at Nestlé USA. Nicholas has 27 years’ experience as a practitioner and consultant involved in all aspects of application systems design and development within the manufacturing, distribution, education, military, health care, and financial industries. He has been actively involved in large-scale data warehousing and systems integration projects for the past 11 years. He has built numerous data warehouses, using both dimensional and relational architectures. He has published many articles and has presented at national conferences. This is his first book. Mr. Galemmo is now an independent consultant and can be reached at ngalemmo@yahoo.com.
Jonathan G. Geiger is executive vice president at Intelligent Solutions, Inc. Jonathan has been involved in many Corporate Information Factory and customer relationship management projects within the utility, telecommunications, manufacturing, education, chemical, financial, and retail industries. In his 30 years as a practitioner and consultant, Jonathan has managed or performed
work in virtually every aspect of information management. He has authored or coauthored over 30 articles and two other books, presents frequently at national and international conferences, and teaches several public seminars. Mr. Geiger can be reached at JGeiger@IntelSols.com.