DW2.0下一代数据仓库架构_第17章 成本验证和DW2.0(读书笔记)

版权声明:
该系列文章(DW2.0下一代数据仓库架构)内容系作者学习用笔记,
欢迎共同学习,所载内容版权归原书作(译)者所有,请勿转载商用。

    毫无疑问,DW2.0的基础设施需要很大的成本。建立它、运维它都需要成本,所使用的设备也有成本。然而,大部分公司都是反对较大支
出。会很自然的被问到“这个新的设备需要大量的成本,你确定它值这些成本吗?为什么我要做一个这么大的投资?”,这是高层管理人员
最容易问到的问题,那作为DW2.0数据仓库的提倡者,该如何作答?

宏观层次的价值验证

    回答管理层的一种方法是在宏观层次进行回答。宏观层次是指你看到一些大的因素,并且可以讲DW2.0的价值联系到这些大的因素上。你
可以说某公司引进的DW2.0,然后他们的股票涨了,也可以说某公司引进了DW2.0,然后利润增加了。虽然DW2.0对股票价格或者是利润很可能
是有利的,但如上所说还是缺乏可信度,因为有很多种因素影响到一个公司的股票价格和利润,而DW2.0只是许多因素中的一个。所以,在宏
观上很难证明DW2.0的价值。

微观层次的价值验证

    在微观层次上解决DW2.0环境的价值验证问题是一种更为可信的方法。在微观层次上可以对DW2.0环境的建立和操作形成更令人信服的理
由。比如有两个公司A和B,两个公司都存在过时的系统,这些系统运行了一段时间,并且两个公司都需要新的分析。A公司没有DW2.0设施,
而B公司建立了自己的DW2.0数据仓库,A公司在建立一个新的分析时,只能回到它的遗留应用程序库。那些遗留的数据是A公司唯一要操作的
数据,没有其他的数据。A公司需要进入遗留的环境,1、查找到需要的数据2、收集数据3、整合数据4、演绎数据5、创建一个新的报表和分
析。A公司为得到数据,旧的遗留数据就必须有文档记录,然而许多较旧的遗留系统并没有文档。其次,当找到文档后,这些文档还没有更新
至最新。另外,在检查旧的遗留系统时还会发现很多混乱的地方,没有命名标准,运算方法不同还有许多不同的编码标准等等。更为糟糕的
是根本没有文档。已经没有太多的程序员或者分析员能够理解当时的技术。所以,寻找和理解旧的遗留系统环境产生的数据是非常重要的任
务。假设能够找到并解释旧的遗留代码,下一步便是从遗留环境中收集数据。这需要已经消失很久的定位技术,找到这些技术才能从遗留系
统中得到大量的数据。整合数据也不那么容易,如果数据来自多个不同系统,那么整合更加困难。关键字不同,数据格式不同,一些数据丢
失并且必须采用默认值,相同的属性有不同的名字,数据定义不同等等。面临挑战多多,A公司生成一个新的分析需要多少成本?这全部取决
于遗留环境以及分析的要求。有些遗留系统过于混乱有些比较好处理,有些报表和分析非常简单,也有非常困难的。根据生成过程的细节,
建立一个新的分析大概需要100 000美元大10 000 000美元,时间大概需要3个月到3年。受制于其他多种因素,成本往往会发成较大变化。如
:遗留程序的个数;遗留程序的复杂性;遗留应用程序的文档;遗留环境的技术架构;新数据需求的复杂度;需要分析的数据量;新信息所
需要的数据元素的个数;遗留数据库与当前最新版本的匹配程度;遗留环境的操作系统等等。那么B公司有怎样呢?利用DW2.0设施建立一个
新的分析需要多少成本?1000到10 000美元和1小时到5天就够了。由此可见,DW2.0极大地降低了一个公司的信息成本,DW2.0打开了通往之
前本来已经存在却不能访问的信息的大门。

考虑DW2.0的成本
    但是建立DW2.0设施也是需要成本的。构造和操作DW2.0设施并不廉价。当然大部分成本取决于数据量、用户量、遗留系统的数目、数据
保存的时间长度以及分析的类型等等。但是针对此次分析的目的,我们假设一个DW2.0设施需要花费5000 000美元。假设A公司新生成一个报
表的成本是700 000美元。B公司在DW2.0基础上10 000美元完成。那B公司则要花费5010 000美元,这样DW2.0的成本令人望而却步。

信息的现实情况
    现实情况如何呢,任何一家公司无论规模大小和复杂程度如何,都不会仅仅在一个报表上运作其所有的业务。一个中等规模的公司至少
也要有100个报表,大公司甚至可以达到上千份报表。假设按照100个报表来算,A公司需要70 000 000美元,而B公司6 000 000美元。那样比
较会选择哪个呢?

信息的时间价值
    DW2.0能极大地加快信息获取的速度。想想一下,boss向你要一份报表,你在一系列旧的遗留系统中寻找,6个月后终于找到了那份分析
报表,这时boss可能已经忘记以前让你做过这件事情了。the other way,如果可以在第二天完成这份分析,第二天早上8点带着这份报表走
进老板的办公室,你的信息对老板来说会有多重要?信息的时间价值是缺失存在的,DW2.0环境可以大大加快信息访问的速度。

整合的价值
    对许多企业来说,仅仅是整合,DW2.0环境的成本就是值得的,通过整合,来自一个位置和一个应用的信息可以与另外不同的位置和应用
的信息连接起来并相关联。这种连通性的结果就是整合,有了整合,就可以完成一些有价值的东西。例如用户可以对数据创建一个真正的360
度的视角。

历史信息
    DW2.0环境还有一个无形的利益,就是从时间的角度来查看数据的能力。在DW2.0出现之前有许多遗留系统,这些系统大部分都是面向事
务的,因此哪里存在事务,哪里就需要提高性能。当提高性能是,可能会移除一些不必要的数据。在遗留环境中的趋势是尽可能地丢掉历史
数据,系统中的历史数据越多,系统运行就越慢,最终的结果是在遗留系统中只有少量的历史数据。但是这些历史数据是有实际价值的。如
果事务处理环境不是存储历史数据的位置,那么DW2.0环境就是存储历史数据的好地方。

第一代DW和DW2.0在经济效益上的比较
    第一代数据仓库有将大量数据存储在磁盘存储上的习惯。实际上许多第一代数据仓库只是把数据存储在磁盘存储器上。
    但是DW2.0认为除了磁盘存储器外,还至少要有两个地方存储数据。DW2.0认为,当数据还会被访问但是访问几率较低时应该存储在近线
存储中,而且归档数据通常也不存储在磁盘管理器上。DW2.0的成本也明显的少于传统的第一代数据仓库的成本。


总结:
   在宏观上对DW2.0进行成本分析是一件很难的事情,在许多宏观因素下,DW2.0环境所带来的好处不能体现出来,微观方面却能证明DW2.0
较为低廉测成本。对于很多报表和分析时,DW2.0环境的成本要比没有DW2.0环境低很多。还要考虑其他一些非经济因素:数据的时间价值、
数据整合价值以及已经可用的历史数据。DW2.0环境开启了一扇大门,使得组织能够去查看数据并做数据分析,这是都是以前做不到的。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26613085/viewspace-1309772/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/26613085/viewspace-1309772/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值