数据仓库和数据集市的鸡与蛋问题

 

     数据仓库实现有两个基本的方法:(1)采用自上而下的方法,先建立数据仓库然后向各个数据集市提供数据;(2)采用自下而上的方法,几个部门的数据集市组成数据仓库。那现在的问题是建立数据仓库还是先建立数据集市?

    两种方法各有优缺点如下:

自上而下的优点是:1、从整个企业的业务角度看待数据;2、数据都是有机的结合,不是有彼此分离的数据集市组成;3、对数据的内容唯一、集中的存储;、集中控制和集中的规则;5、对反复的查询能够作出快速的反应。缺点是:1、需要花费较长的时间来完成建设;2、失败的风险很大;3、需要实施人员具有高水平的综合技能;4、实施费用过高并且不容易看到结果,向高层管理和投资者推销比较困难。

自下而上的有点是:1、实施快速而方便;2、良好的投资回报;3、失败风险较小;4、这个过程是渐进的,可以有选择的先建立重要的数据集市;4、团队实施人员可以在实施过程中学习和成长。缺点是:1、每一个数据集市对数据的视角都比较狭窄;2、每个数据集市都有冗余数据;3、总是有矛盾和不一致的数据;4、增加无法管理的接口。

 

   可以根据这两种方法的优缺点,考察企业需要的是什么来决定使用那一种实现方法,是长期的结果?还是关于几个主题的快速数据集市?

如果上述两种方法都不合适,可以采用两者结合的折中方法:1、从这个企业的角度来计划和定义需求;2、为完整的仓库创建一个体系结构;3、是数据内容一致而且标准化;4、将数据仓库作为一组超级数据集市来实施,每次一个。按这种方法实施,数据集市就是数据仓库系统中的逻辑子集,数据仓库就是一组数据集市的集合。而企业中单独的数据集市是为特定的商业部门而建立的,并不是数据仓库中数据集市的简单集合。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值