(一)
最近正在学习数据仓库建模鼻祖之一Kimball大师写的《The Data Warehouse Toolkit:The Complete Guide to Dimensional Modeling》,虽然还没有看完但也已经有些感触。
第一,理论化了数据仓库模型设计的原则和维度建模的基本步骤
在我们进行数据仓库建模之前,无论是Kimball大师的维度建模还是Immon大师的3NF数据仓库建模,首先我们所必须要考虑的应该都是我们模型设计的原则, 我们在这些原则的基础上设计的数据仓库模型更易成功。总结起来大致有这样几点:
- 数据易于存取:数据仓库的数据不能仅仅对开发人员是易理解的,应该还要考虑到业务人员。
- 展现数据一致:业务人员也经常会烦恼同一指标由于取自不同系统而最终数据不同,这为他们的分析工作带来很大困难,不确定到底哪个数据时正确的,那数据仓库的设计原则之一就是解决这一问题,因为数据仓库可能会整合来自许多不同业务系统的数据,使来自不同系统的数据有统一统计口径,保证从数据仓库的任何地方取出来同一指标的数据都是一致的。
- 有广泛的适应性和易修改性:因为业务变动是不可回避的,业务变动以后数据仓库必须能够快速的响应这些变动,所以一定有适应性和易修改性。
- 在推进有效决策上扮演最基本的角色:什么是数据仓库?数据仓库就是在适当的时间将正确的信息传递给适当的人,以做出正确的决策。数据仓库最多也都是应用在企业经营分析与决策支持项目上。因此数据仓库应该在企业的决策支持上扮演重要角色。
- 能起到安全堡垒作用:保证数据安全,这是对任何一个系统,一个项目最基本也是最重要的要求。
- 能被业务人员所接受:如果在培训一段时间以后,如6个月,业务人员仍无法使用,那么数据仓库在推销考试中就失败了。
做任何事情都需要有一个执行步骤,维度建模也不例外,Kimball大师有一个维度建模四部曲:
- 选取并理解要建模的业务处理过程
- 定义业务处理的粒度
- 选定维度
- 确定度量,即确定用于形成每个事实表行的数字型事实
在四部曲中的第一条就是理解业务,可见理解业务在数据仓库的建模上的重要性。只有理解了业务并将通过用户访谈将其对业务的理解作为确定维度模型所需维度和事实内容的依据,同时考虑源数据本身才可能建立一个成功的模型。
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22556479/viewspace-1030957/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22556479/viewspace-1030957/