from http://soft.chinabyte.com/18/3438018.shtml
随着企业信息化程度的不断提高,各类应用系统同时并存并支撑着企业的业务应用。越来越多企业的信息化主管在开发企业应用时已经考虑到数据集成和将来对数据的整体有效利用,因此,在实施了ERP解决方案之后,很多企业选择实施数据仓库产品来避免信息孤岛,实现应用的内部联系和信息的共享。
实施数据仓库的企业,用何种标准去衡量本企业的数据仓库建模是成功的呢?也许很多负责企业信息化建设的主管自己也不是很清楚。原因是:起初企业决定要实施数据仓库的初衷大都因为一些跨模块的报表开发不能够实现,企业实施了ERP之后,财务报表,销售分析的报表都很容易可以通过报表开发实现了,但一些跨模块的集成报表变得十分复杂,例如一个服装制造企业,高层主管需要看到每个零售店铺的销售净利润,但零售店铺的几乎所有信息都在零售系统中,而财务的相关信息在企业的ERP中,此时就需要将信息集成在企业级的中央数据仓库中,去满足此类集成的报表数据需求。
在数据仓库的建模过程中,实施人员往往会从满足报表需求的角度出发,考虑如何搭建数据模型,而项目实施成功后的交付品就是实现了这样的报表需求,信息化主管此时也满意的结束了数据仓库的项目,这样就算是成功的实施了数据仓库建模吗?
请各位思考以下几点问题:
1、随着竞争加剧,企业也需要加速改变架构及行销策略,如果企业组织架构发生了变化,也就意味着数据仓库中的主数据发生了变化,目前的模型中是否能灵活应对主数据的变化?
2、随着企业业务量的上升,源系统中的数据量也增大,数据仓库在抽取数据的过程中是否会降低业务系统的运行效率?
3、不同的业务数据源是否能够重复利用,如果有新增的报表需求,能否在现有建模的基础上灵活实现?
以上提到的几个问题与数据建模的思想息息相关,运用的得当,则企业在现在及未来都获益不少,否则,对于企业而言可能在两三年,甚至几个月后就需要推到现行的项目重新要在软、硬件上投资了。
针对上述问题,数据仓库领域提出了EDW的数据建模思想,通过数据分层和在数据仓库中保留企业的范围内一致的原子层数据为企业建立灵活,可靠的数据仓库解决方案。
EDW的建模思想将数据仓库区分为三个层次:
一、Extract Layer(数据提取层)
SAP BW将数据仓库的数据源分为两种:SAP 数据源和Non-SAP 数据源。SAP BW和mysap.com的组件完全集成,将各组件的数据源由预定义的提取机构及程序传输到BW的数据提取层。对于Non-SAP的数据源,BW有开放的架构,通过BAPI接口传输数据。
提取层的数据保留了来自源系统的原始数据,存储在二维的表中,以便于下一步的数据清洗、整合。其优点是:一次抽取到BW后,如果模型作了更改,不需要重复去源系统中抽取,而直接从BW表中抽取,提高数据仓库的提取效率,降低对源系统的资源占用,解决了上述第二个问题。
二、Integration Layer(数据合并层)
将提取层的原始数据进行清洗和整合,其实质就是建立数据源之间的关联,把有用的相关数据统一放在二维表中,例如:把FI/CO的数据源整合到一个表中,以便于下一层的建模的使用。数据合并层能够将提取层的原始数据自由组合,满足多变的业务需求,解决了上述第一个问题
三、Data Mart Layer(数据集市层)
最终的报表将在这层膜型上建立,所以,该层将使用星型数据模型(BW中称之为InfoCube)创建不同的分析纬度,提高查询的效率。
数据上载的流程从源系统到数据提取层,在由数据合并层清洗、整合后传输到数据集市层建立多维模型。EDW建模思想的优势在于:将未来企业可能发生的业务变化,用三个层面的模型灵活处理。例如:当企业组织架构变化,即主数据发生变化后,BW可以在数据合并层应对主数据的变化。