理解BW数据模型 - 信息立方体模型

信息立方体是SAP BW实现的多维数据结构,用于构建高效的数据仓库。它采用扩展星形结构,利用SID关联维度和主数据,包含压缩和未压缩事实表,最多16个维度表,如PACKAGE、TIME和UNIT维度。信息立方体通过减少字段和冗余存储来优化数据,LINE_ITEM维度处理高基数特征值。激活信息立方体后,系统自动生成遵循特定命名规范的数据库表。
摘要由CSDN通过智能技术生成

多维数据结构是数据仓库普遍使用的数据建模方式,而标准信息立方体就是多维数据结构的SAP BW实现。通过它,我们可以构建出相对高效的多维数据结构,而不需要关心太多的多维数据结构的细节。标准信息立方体就是一种星系结构,不过SAP BW对它做了一定的扩展,也就是所谓的扩展星形结构。而且信息立方体通过使用SID (SURROGATE ID)来关联维度和主数据,这样可以提高数据的访问效率。


119153_201001262012171.jpg

如图所示,一个信息立方体包括两个事实表:一个用来存储压缩数据(E表),一个用来存储未压缩数据(F表)。另外一个信息立方体还以最多有16个维度表,这16个维度中的3个是系统自动产生的:PACKAGE维度,TIME维度,还有UNIT维度(戏称PTU)。其他的维度是开发顾问构建的。

信息立方体的事实表包含两部分的信息:一是所谓的事实信息,比如数量,收入,折扣等。还有就是对维度表数据的引用,也就是维度ID(DIMID)。维度ID是数据导入的时候自动产生并写入到事实表和各个维度表中的。通过DIMID,事实表的数据可以和各个维度表的数据关联起来。信息立方体的维度表,一方面用来减少事实表中的字段,因为多个特征值可以被组合到一个维度中;另一方面,维度表可以减少一些高关联度的特征值组合的存储冗余问题。

信息立方体维度的一个特例是LINE ITEM维度,它主要用于那些高基数(HIGH CARDINALITY)的特征值。典型的例子就是DOCUMENT NUMBER;对于那些终端用户量非常大的行业来说,CUSTOMER NUMBER也可以是LINE ITEM维度,比如电信、银行、保险等。对于LINE ITEM维度来说,系统其实并没有产生一个维度表,而是直接把主数据SID表中的SID作为ÿ

传统的Cube:星型结构,由事实表和维度表组成,事实表存放的是业务数据以及它本身独有的信息和指向周围维表的外键,事实表的主键由维度键值组成;维表中存放的是特性值,由一个维度键值和多个维度属性组成. 改进的Cube:星型结构,由事实表、SID表(存放的是由系统自动为每个特性生成的SID码(4位整型值)和维度键值(4位整型值),其中SID码是主数据表中的主键)和主数据表组成;SID表中存放的不再是特性值,它存放的是SID码和维度键值(由系统自动生成),特性值存放在主数据表中.此时的维表包含SID表和主数据表,其中SID表中只存放了该维表的维度键值和它包含的特性的SID. 改进的Cube相比传统的Cube的优点: 1、主数据跨信息立方体的使用(共享维度) 2、可以对关键值进行聚集 3、查询性能更高 DSO:简单的二维表结构,有关键字字段和数据字段组成,可分为3种类型: :标准数据存储对象 由有效数据(已激活数据)、更改记录和新数据(待激活数据)3张二维数据表组成.数据通过DTP进入到DSO中,新数据在激活之前存放在新数据表中,此时报表层面是看不见数据的,只有在激活后才能看见。更改记录表记录了数据激活前后的变化,为从DSO向其他信息提供者更新数据提供了增量机制. :写优化的数据存储对象(通过DTP抽取数据)(1张表) :直接更新的数据存储对象(不是通过DTP抽取数据,而是通过API函数直接写入DSO中)(1张表) ----------------- :同一主键的数据在DSO中是独立存放的,但在Cube中是要计算的(其实这些是在DSO中可设置的). :SID的主数据,可能包含属性、文本和层级结构三个部分,不同的部分由不同的数据表存放.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值