InfoCube 信息立方体

转自:http://blog.sina.com.cn/s/blog_9d51fca201011ky9.html
学习SAP InfoCube首先要了解什么是星形接。下面图示说明了什么是基本的星型链接,具体详细信息请到BW310去查看。

clip_image001

clip_image002[17]

经典星型模式的优势和劣势

 优势:

 由于只有少量的联合操作(只有数据表和相关维度表之间的联合操作),因此能相当好地执行数据访问。

 劣势:

 维度表中存在冗余的条目。

 与事实数据(通过时间维度表含蓄提供时间参考)的历史记录(如何对时间建模)不同,维度(缓慢更改的维度)的历史记录不易于建模。

 繁琐的多语言能力。

 对维度中的一些层次结构类型(例如,不平衡的并行层次结构)进行建模可导致出现异常。

 由于集合和基本事实数据存储在相同表(数据表)中,因此降低了查询性能。

       SAP BI 中的多模型是基于SAP BI 星形构的,而SAP BI 的星形构是了解决传统的星形构存在的问题而成的。SAP BI 星形构中,事表中的事指的是关键值度属性指的是特性,与前面介的内容是一致的。度表通或主关系接到中心的事表。与传统的星形构相比特性不是度表的件,也就是,特性没有存度表中。度表中存SID SID 代表替代ID C 替代性的键值)键值冠以前SID ,如"SID "是客SID 

       每一个度表有一个系生成的数型的关键值,称为维键值。主数据信息存在独立的表中,和信息立方体无关,称主数据表。其中,属性、文本和层级分开存

     SAP BI 中,把事表及与其接的度表称信息立方体。一个信息立方体包含一系列的关系型表格,些表在多的基合起来。话说,信息立方体包含一个中心的事表和几个围绕度表。主数据表通SID 的方式接到信息立方体(到事的关)

信息立方体的分

(1) 基本信息立方体

具有物理数据存的,我基本信息立方体。基本信息立方体又分为标准信息立方体和实时信息立方体。

)准信息立方体。准信息立方体的数据只能通过转换或更新规则批量加,在使用信息它是只的,不能实时行写操作。在技术处理上,对标准信息立方体访问方面的性能化。信息立方体不能用于划数据的写入,只用于需要存取数据的景,可以为计划提供参考数据。

2) 实时信息立方体。实时InfoCube 几乎专门用于BI 集成计划的工具集。实时信息立方体可以支持平行的写访问功能。当划数据的候使用实时信息立方体,支持多个用将数据写入信息立方体

InfoCube 正好包含一个数据表*,在这个表中存储了关键值的值。数据表最多可以包含233 个关键值。

InfoCube 通常最少包含个维度表,最多包含16 个。这些维度表中有13 个是客户创建的,个是SAP 提供的:单位维度表数据包维度表;时间维度表。

       客户维度包含SID,这些SID 最多与248 个特性InfoObject 相链接。

提示如果您拥有一个包含13 个维度表,每个维度表又有248 个特性的InfoCube,那么您将得到一个超乎想象的业务流程或者不好的建议!

       只有在至少有一个关键值属于“金额”或“数量”类型时,才会出现单位维度表。在这种情况下,固定/可变的单位/货币需要与关键值一起输入。 维度表不包含特性/特性值,但是包含相应的SID /值。

     

clip_image003

clip_image004

下面我们来看看怎么在BW中创建一个简单的信息立方体。

在你指定的InfoArea上面右键,点击创建信息立方体(Create InfoCube),然后出现下面的对话框。

clip_image006

输入对应的名称和描述;如果勾选Real  Time则为实时信息立方体。然后点击左下角的新建按钮,这时你的信息立方体既被创建。

在下图的左边,是构成CUBE的信息对象目录,右边则是一个信息块的结构。首先注意的是左图上方的几个小按钮,分别表示信息源信息对象信息(CUBE信息对象目录所有信息对象,一般来说根据需要选择自己需要的信息对象,如果我选择了某一目录后,则其下所有的信息对象会在左边呈现。然后你可以右键维度或者关键值来添加或修改相应的信息对象。

 

clip_image008

当对维度进行创建或对象输入时后,出现下面图示。然后我们来解释一下什么是Line Item Dimension(行项目维)High Cardinality(基高基数)。

clip_image009

(1) 

知道在一般的情况下,信息立方体的度表存放的是ID 和多个特性的SID 对应关系,通SID 接到主数据。设计提高了模型的灵活性。但是在某个情况下,设计不是最的。

例如,用希望将订单编号作一个特性行分析,因而在信息立方体中每一个订单编对应着一个或几个事表中的事数据。意味着包含订单编号信息象的度表与数据表相比将很大。这样又会查询处理的问题,因为这订单编号的使用会建大表接,不是数据表和订单编度表之,而且也在订单编号信息象的度表和主数据表之间创接,这样设计致特性表、度表和事表三个大表之的多重接,不利于性能的提高。如果上述情况出在信息立方体中,意味着,信息立方体的度表与数据表几乎一这时,不能再使用星状接技术连些大表。BI 提供了""选项。就,将标识为度,并且该维度表分配一个信息象,即行目信息象。激活信息立方体,系不会建新的度表,而是将信息象的SID 直接保存到信息立方体的事表中,字段直接指向信息象的主数据标识符表。话说忽略了使用度表的路线。从星状表中的"信息度→信息"成了行度中的"信息→信息"接方式。信息立方体的事表直接与主数据表的SID,而没有度表,在度中只有一个特性。常订单票号等。

       这样设计使得在表运行中,无需行大数据量的(Join) 理,在数据上传时

也无需通过维度表来确定ID 。不足之是由于没有度表,在选择时,无法使用F4 帮助的功能。

(2) "基数高度"选项

SAP BI 提供的另一个度性能化的选项"数高度"选项"基数高度"标记的一个可以置的属性。当一个度包含很多条目(记录),或者具有很高的基数高度标识可以提高性能。一般而言,度的记录数至少是事表的记录数的20% ,可标识如果置此标记,那么生成信息的数据,系会自动调整表的物理格式。例如,选择合适的索引(据特定数据而有不同),从而保度中的记录时具有良好的性能

添加导航属性和关键值的操作如同添加维度。

以上如果一切搞定,则可以检查激活CUBE,这样CUBE就算建立成功了。

    接下来,可以仔细端详一下CUBE中有哪些需要机关了,那么就要让管理这个管家一同带我们走入。先粗略了解一下CUBE的表结构,其中CUBE中首先存在的两张事实表F表与E,其中F表为数据初始加载时候的数据,这样的数据中存在着加载的时候的数据包(DTP包)信息,正是由于这个数据包(P)维度的存在,会导致F表中的数据量很大,所以当我们确认每包数据没有问题后,我们就可以做压缩的动作,压缩后系统将数据包维度去掉,这样大大减少了Fact表的数据量,并且将数据从F表转移到E表;而对于CUBE每个维度,BW会建立一个Dimension表,Dimension表中包含DIMID及组成信息对象的SID,最后事实表与信息对象通过DIMID关联。

下面通过实际来看看CUBE中数据的奥妙,选中CUBE右键点击管理,首先看到的内容标签页。

clip_image011

其中上方即为CUBE所包含的信息对象,其中的栏指的是每个信息对象数据哪个维度。而信息块内容则是指当前CUBE中的数据,他包含压缩前和压缩后的所有数据;实际表格指的就是F表,点击实际表格后,就可以看到如下:

clip_image013

   其中表名即为/BIC/F+CUBE名称;第三个按钮选择性删除,就是根据某些条件删除数据,例如某一些数据是不需要的数据,可以通过此办法删除,但是一般需要慎重,因为删除后即不可恢复。

    第二标签页为性能,顾名思义,这一屏是为CUBE性能考虑而设计的,如下图

clip_image015

其中上半部分为创建和删除索引,下半部分为创建统计。其中第一部分检查、删除及创建、修正索引为对F表中的数据进行索引创建,索引可以提升查询速度,所以很重要,但是在加载数据的时候,请务必先删除索引再添加索引,否则很容易在大量数据加载时候产生死锁(Dead Lock);所以在处理链中向CUBE加载数据时候,一般都是加载前删除CUBE索引,而加载成功后再创建索引;第二部分为压缩后的聚集索引,即为E表的索引。而其中的数据库统计,按照SAP的解释,即为系统做一个统计以便了解CUBE、信息对象以及查询等的使用频率等,为系统的优化做一个依据,见其解释如下:

BW statistics provides you with the following options that allow you to evaluate data from both the OLAP processor and warehouse management. You are able to

·        get an overview of how InfoProviders, InfoObjects, InfoSources, source systems, queries, and aggregates are used

·        determine the system performance and improve it

·        improve the way in which aggregates are selected and used and reduce the cost of updating them

    CUBE的第三个标签页请求,此页主要记录了数据加载的信息,包括每个信息包的执行时间以及数据量等信息,而其中被压缩的数据包在信息块的压缩状态中会打上,如果聚集被压缩,则在汇集的压缩状态中也会打上相应的;在请求的数据集市栏下,如果该CUBE被作为数据集市(即作为其他信息提供者的数据源)且该信息包数据被抽走,则会标记上一个“方块按钮”,如果是加载后的数据包没有做压缩等处理,则可以选中点击删除将一整包数据删除。

clip_image017


接下来的屏幕为滚动rollup)界面,这个界面目前我所知道的作用为点击集合生成聚集(Aggregate),在生成聚集后,系统会根据相应维度生成一个数量相对CUBE事实表数据量比较小的表,当查询访问CUBE时候,系统会先判断聚集中维度是否满足条件,如果满足则直接访问聚集而不用再次访问CUBE,提升查询速度。

clip_image019

        折叠”,这一屏的作用就是前文多次提到的压缩的概念,在请求标识中输入标识序列,则将该序列前所有的数据包都压缩,如果勾选使用零排除则会将关键值为0的记录排除,但是这个功能只对累计的关键值有效,而对于非累计的,由于是根据其他信息对象流入流出计算而得,所以并没有作用;执行压缩后的数据会自动存入E表,并且将原先的数据包序列全部变为0,这样如果再想删除已经压缩的请求包数据,是不可能实现了,这样实现了数据的固化,也大大提高了查询的效率。

clip_image021

    最后一栏重新建造3.5的遗留产物,不了解也不必要在继续了解了,所以不谈。

clip_image023

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值