【翻译】数据集市

     关注业务流程,而不是业务部门

     行业里一个最常见的做法是将数据集市按照业务部门进行定义。我们可以看到无数的数据仓库架构图中包含一个个“市场数据集市”,“销售数据集市”,“财务数据集市”。在你回顾这些部门的业务需求后,你一定会不可避免的发现这三个部门需要相同的核心信息,比如订单数据。不要构建包含订单的市场数据集市和包含订单的销售数据集市,而应该构建单一详细的订单数据集市,允许多个部门访问。

     专注于业务流程,而不是业务部门可以更加经济地在多组织间传递一致性信息。如果你建立的是跟部门绑定的集市,那么会导致重复数据。不考虑源是来自于操作系统或者是中央数据仓库,进入集市的多重数据流将导致数据的不一致。最好的办法是确保只发布一次数据。单一的发布将减少ETL的开发成本,持续的数据管理负担以及磁盘存储需求。

     当然了,在考虑到常见的基于部门构建,以流程为中心的数据集市有点错综复杂。不过你可以通过审查在维护同样的很大的事实表而产生的不必要的成本来推广该理念。尽管部门间存在阻隔,但是管理层对减少成本还是有兴趣的。

     那么在公司机构里如何识别出业务流程呢?第一步是倾听你的业务用户。在你搜集需求的时候,你应该调查关键的操作型来源系统。事实上,最容易的方法是根据源系统来定义数据集市。根据单独业务流程和源系统识别出数据集市后,就可以重点关注跨流程的数据集市,比如供应链,或者所有来自于客户满意情况的输入等。我们建议你将解决这些更复杂的多流程的集市作为第二阶段。

当然了,跨数据集市你必须使用一致的维度。我们强烈建议画一个数据仓库总线矩阵图来确立和沟通你的整个数据集市策略。你要做的是不要让你的矩阵行上出现“市场”,“销售”,“财务”。

 

PS:上面提到了Data Warehouse BUS Matrix。

 


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值