BW 基础信息

一、BW是什么

SAP BW 是mySAP 商务智能( BI )的集成化组件,为SAP数据和非SAP数据的采集,存储,分析和管理提供一个集成的,面向商务的平台。

SAP商业智能(BI)意味着分析和报告来自不同异构数据源的数据。它允许您从多个数据源获取数据,数据分段,可以进一步分发到不同的BI系统。SAP商业智能系统可以作为数据传输或源系统的目标系统,将数据分发到不同的BI目标。

SAP 的最底层是数据仓库( Data Warehousing ),然后可以分为三层:

第一层主要完成的任务包括,ETL流程( Extraction , Transformation , Loading ),数据仓库管理和商业建模三块内容。 其中的ETL流程,通过各种途径和方法,把种类繁多的元数据进行处理,清洗,从而转化为系统所需的统一格式的数据类型,便于之后所有的需要。是BW中非常基础非常关键的一步。之后的数据管理将这些数据根据种类,划分为主数据,PSA,ODS object等不同的类型,加以管理。

第二层 BI Platform ,BI中偏重逻辑处理的一块,它把Data Warehousing的数据,按照需求进行各种计算,规划和进一步的细致的处理,这一层更多地是对数据进行统一的处理和基本的封装。在这一层里面,完成的内容有business calculations, planning and forecasts, exception scanning, alerting, query pre-calculation, caching, background printing和data mining等。主要的产品有OLAP,metadata management,data mining,Analysis process designer and BPS(Business Planning and Simulation,最新的叫IP)。

第三层 BI Suite,是对BI Platform的进一步加工,加入一些商务智能的要素,比如Query的多样化选择,自动报表的生成,多维度的数据分析,信息发布,公开的面向第三方的分析接口和具体的Web页面体现等。有了BI Suite,SAP的BW才显得更为全面和专业。

 总的来说,BW建模三二一:三个仓库,两辆车,一个传输规则。

三个仓库:

1、目标:( InfoObject ,Infocube ,DSO等 )

2、PSA

3、Data Source

两辆车:

1、Infopackage

2、DTP

一个传输规则:

1、Transformation 

               

 

 BW的ETL数据抽取

BW的ETL数据抽取,就是把从R/3和外部系统或文件中的数据抽取到我们建立的立方体中,进行分析,所以我们做的所有工作,包括,建立特征维度,事实表维度,信息对象,信息立方体,以及DSO对象,和数据源,全部都是这六大步的砖瓦。

二、信息对象

InfoObject , BI中存储数据最小单位,是建立数据模型的基础。是SAP BI 系统中对现实生活中的的业务评价对象的模拟。

比如:客户,销售额,科目,货币等。

BI中提供了很多的InfoObject,InfoCube也就是对这些InfoObject进行组合,对于数据分析有很好的耦合性。

InfoObject,物理数据模型,可以由InfoProvider本身,也可以再InfoProvider中使用。Data Store对象是一个由InfoObject 组成的InfoProvider。

BW除了可以将数据抽取到PSA和DSO之外,也可以将数据收入到InfoObject。

InfoObject分为Characteristic 特性和Key Figure 关键值,分别用来管理文本型和数字型的数据。

信息对象是按照信息范围分类存储的。信息范围就好比是文件目录 ,可以将各种对象进行分组。在信息范围下,可以包含其他的信息范围,也可以包含信息对象目录。信息对象目录是专门用于对信息对象进行分类的目录。 信息对象分为关键值和特性两大类,分别存入关
键值信息对象目录和特性信息对象目录中。信息对象目录可以根据其分类需要再分别存放在不同的信息范围( InfoAreas )中,以方便对信息对象的管理。

  • 关键值

关键值是指业务评价中的数值部分 ,用来存储要分析的数值 ,如金额、数量、天数、分钟数等。除了在数据库中物理存储的关键值,比如销售收入、固定成本、销售数量、职工人数等,还可以在业务浏览器中定义一些派生的关键值,派生的关键值是由信息立方体中的关
键值经过计算得到的,比如人均销售收入、百分比偏差、边际贡献等。

  • 特性

特性是业务评价中涉及的评价的对象,多是非数值型的内容,用来对数值进行界定 。比如公司、产品、客户、财年、会计期间、地区等。关键值只有与一系列的特性相联系,才有了具体的含义。SAP 数据仓库中把特性分为以下类型:
·业务特性(如客户,成本中心和公司等);
·单位(女口货币和数量单位等);
·时间特性(如年、月、日、财年、会计期间等);
·技术特性(如数据加载程序的顺序标志等〉。

特性可以包含主数据、描述、层级结构三部分信息 。特性主数据包含每个特性值的惟一
标识,还可以带有其他属性。

信息块

 信息块是有特征和关键指标信息对象排列组成,所以特征和关键指标信息对象是可重用的

1、创建信息范围 -- InfoArea

 2、创建信息对象

InfoObject共有四种类型,特性 ( Characteristic )、关键值( Key Figure )、单位 ( Unit )、XXL InfoObject 

  •  特性:这些特性指定关键指标存储再InfoProvider(信息提供者)中的力度,如果特性具有属性,文本或者层次结构,这些被称为承载数据的特征。

       数据类型:时间特性是日期,会计年度等特性,技术特性仅存在BW内部管理目的。SNUMC可以将整数格式的数据转换为另一种格式。

  •  关键值:可以是数额、数量或者项目数。其属性会影响数据加载的方式和查询的显示方式。这包括分配的货币或者度量单位,汇总等。

 

  •  单位:是关键值数据有价值的必要条件

 

 XXL:可以使用MIME类型进一步制定数据类型,支持多种格式,包括不同文档类型,音频文件等。

三、原系统

可以使用SAP BW/4HANA中的原系统来设置与数据传输源的连接。主要管理BW中数据源提供系统,一般是公司的业务系统或者flatfile文件。可以使用开放的ODS视图和Composite Providers虚拟访问数据。所有源都支持完全模式下的数据传输,前提是原支持此模式(通常增量),对于许多数据供应适配器,SAP HANA 源系统支持实时复制。

 

 

  •  SAP HANA Local Database Schema:通过数据库连接方式连接BW/ HANA后台HANA数据库其他模式
  •  SAP HANA Smart Data Access:通过ODBC连接其他系统数据库,如果源系统是通过Smart Data Access与SAP HANA数据库连接的外行数据源,通过此连接类型,可以使用SAP HANA智能数据集成提供的源,与外部源的连接是使用数据供应适配器进行的。作为连接参数,可以指定将源 连接到SAP HANA的远程源,或者可以通过源系统进行访问的源区域。 根据远程源(因此取决于适配器),可以通过指定远程数据库和所有者或架构来指定区域,或者,如果源具有分层文件夹结构而不是架构,则可以使用路径前缀来指定区域。
  • SAP HANA Tenant Database Schema:通过数据库连接方式连接其他HANA数据库,在单个SAP HANA系统中支持多个隔离的数据库。 这些被称为租户数据库,如果将SAP HANA系统的租户数据库中的特定模式用作源系统,则可以使用此选项。然后,可以访问源系统配置中定义的租户数据库的架构的表,视图或本机DataStore对象。
  • Big Data:连接大数据平台 
  • Operational Data Provisioning(ODP):通过EFC连接其他SAP系统 ;
  • File:连接手工数据文件。

Smart Data Access :

 

 

 四、数据源

数据源是一组字段,为业务部门提供数据以进行数据访问和提取,以及将数据传输到SAP BW / 4 HANA。从技术角度来看,Data Source是一组逻辑相关的字段,提供了这些字段一平面结构( 提取结构 )或多个平面结构( 用于层次结构 )的形式访问数据并将数据传输到SAP BW / 4 HANA中。

数据可以通过数据传输过程或者信息包从数据源结构中的源加载到SAPBW/4 HANA系统中,再转换过程中,确定将数据从数据源传输到的目标,还可以将数据原字段分配给InfoObjects或SAP BW / 4 HANA中目标对象的字段。

DataSource是BW中真实数据源,通常被称为PSA层,用来存储和业务系统中完全一致的数据,这一层是临时数据存储层,里面的数据不会一直存在。

 五、转换

转换:操作可以实现整合,清理和集成数据,可以使用语义特征,整合不同来源的数据。当数据从BW对象或虚拟对象加载到目标BW对象时,数据通过转换,将源字段转换为目标格式。

       BW的多级模型中,不同层级之间需要进行数据的传递,Transformation就是完成这一任务。再Transfomation 中可以规定上下级之间数据的对应关系,可以是直接传递等简单方式买也可以时通过自己编写的公式实现复杂的数据整理逻辑。

 转换和DTP数一一对应,转换只是定义数据有源到目标模型的数据转换规则,DTP是按照转换逻辑具体执行数据由源抽取到目标模型。

转换由三种例程:开始历程,结束例程,专家例程

开始例程:再执行转换之前的逻辑

结束例程:执行完转换之后,对处理后的结果集再次进行处理。

专家例程:无转换规则,所有处理逻辑都根据专家例程进行数据处理。

创建转换:

1、创建转换

2、配置源数据

 转换规则类型:

Direct Assignment : 直接赋值

Formula:简单的公式

lookup:根据相应的主数据匹配,相关数据

Constant:常量

Routine:写代码处理逻辑

No Update:不做任何更新

 六、数据流

Data Flow :它描述了一组SAP BW / 4 HANA对象,包括他们之间的关系和相互依赖关系。

Data Flow Object :数据流对象是SAP BW / 4 HANA中描述数据流的TLOGO对象,数据流对象是再图形编辑器中创建和编辑的。它可以可视化数据流中包含的SAP BW / 4 HANA 对象( 及其关系 )。可以使用数据流对象将具有持久性对象和现有数据流的现有业务场景的可视化存储为SAP BW /4 HANA  中的BW对象模型,他们与SAP BW /4 HANA 运行时无关。

 七、DTP

数据传输流程;根据转换规则和逻辑具体进行数据抽取和处理、数据过滤。

DTP主要用于BW内部数据加载,总是和转换成对出现,当转换激活后,则会出现一个相对应的空的DTP文件,要确保每个转换下都要建立DTP。

 

 

Extractiion Model:增量模式Delta ,全量 Full

过滤

 

 八、导航属性

在BI中,属性分为如下两种类型:显示、导航。所谓的属性在单独看来其实还是信息对象。每个特征都可以包含:主数据、属性、层级。例如:特征A、特征B。如果我将特征A放置到特征B的属性中去,那么特征A就叫做特征B的属性。

一般默认的情况下,所有的属性都是显示属性。所谓的显示属性就是在报表开发的过程中仅仅用来显示,并没有其他的下钻的功能,仅仅是为了来描述它对应的特征对象而以。此外,关键值也是可以作为属性来使用的。前提是这个关键值的变化频率要低

九、ADSO数据存储对象

ADSO包括DSO、Cube、PSA。

Data Store Object advanced 特别适合频繁加载和大量数据,通过二维表保存真实的数据,BW通过建立多层DSO模型来完成数据ETL过曾,以得到最终需要的数据格式和结构。

数据存储对象最多包含三个表:激活队列表(Activation Queue)、更改日志(Change Log)和活动数据表(Active Data)。

(1)、DSO的四种类型

  • 标准数据存储对象 ( Standard DataStore Object )

标准数据存储对象适用大多数应用案例和报告。

1)、Write Change Log(写入更改日志):

如果选择此选项,则增量(新记录,已删除记录和更改记录)将保存在更改日志中。更改日志用于提取增量。仅当DataStore对象具有更改日志时,才可以从DataStore对象回滚请求,即可以恢复激活请求之前的状态。

2)、Snapshot Support(快照支持):

如果数据源仅以“FULL”的形式传递当前数据集,通过设置该指标,可以识别、更新已删除的数据记录。激活后,系统将识别活动数据表中但不在加载请求中的记录。这些将作为反向映像写入更改日志。注意:确保在每次加载期间包含所有记录,否则数据可能会丢失。

3)、Unique Data Records:

如果仅将唯一数据记录(具有非重复键组合的数据记录)加载到数据存储对象中,则可以选择此属性。如果选择了该指标,则在激活期间,系统将检查是否存在唯一的记录。如果记录已存在,则激活将被取消,并出现错误。

 

Load Data:把请求加载到入站表中。

Activate:把数据从入站表传输到活动数据表,具有相同密钥的数据将按照指定的聚合进行汇总。如果选择了“写入更改日志”属性,则激活的差异将写入更改日志。

Deletion/Rollback:如果请求尚未激活,则可以从入站表中删除它们。如果要回滚已激活的请求,则只有在选择了属性“写入更改日志”时才能执行此操作。

Extraction:从活动数据表中提取用于更新到另一个数据目标的数据,以进行初始和完全提取,并从变更日志中提取数据,以进行增量提取。

Reporting:执行查询时,将访问活动数据表,因此仅可见先前已激活的数据。 对于标准DataStore对象,没有稳定的指引报告,就像数据集DataStore对象一样。

  • 分段存储数据对象(Staging DataStore Object)

 可以通过选择其属性来以不同的方式使用Staging DataStore对象

Load Data:把请求加载到入站表中。

Activate:对于具有“已启用报告”(Reporting-Enabled)和“压缩数据”(Compress Data)属性的DataStore对象,可以进行激活/压缩。对于仅具有入站队列(Inbound Queue),属性的数据存储对象,则不可以。可以使用命令“compression”,数据从入站表移动到包含活动数据的表,并且根据默认聚合合并具有相同键值的所有记录。使用命令“activation”,相关数据从入站表复制到包含活动数据的表,并且只有在可见的情况下才能进行报告。 但是,具有相同键的记录也会根据此处的汇总进行合并。

Deletion/Rollback:如果数据尚未包含在入站表中(即尚未激活),则只能在请求级别将其删除。

Extraction:对于仅具有入站队列属性且启用了报告的数据存储对象,完全提取只进入入站表。对于属性为Compress Data的数据存储对象,同时访问入站表和包含活动数据的表。增量提取总是从入站表执行。对于属性为Compress Data的数据存储对象,必须首先将请求更新为所有活动的增量DTPs,然后才能对其进行压缩(激活)。

Reporting:属性为Inbound Queue only和Compress Data的数据存储对象只能在非常有限的范围内用于报告,因为Inbound表中的数据在逻辑上仅与对象相关,但查询不知道激活逻辑,因此无法聚合记录。因此,无法将此类型的数据存储对象添加到CompositeProvider。对于Reporting-Enabled属性的数据存储对象,报告仅在包含活动数据的表上进行,这意味着数据只有在激活后才可见。此类型的数据存储对象可以添加到CompositeProvider。

  • 数据集存储对象(Data Mart DataStore Object)

 Data Mart DataStore Object对报告分析进行了优化,112。

  • 直接更新数据存储对象(Direct Update DataStore Object)

 可以使用API将数据直接写到活动数据表中(Active Data)。

 (2)、DSO和CUBE的区别

DSO ( DataStore Object ):存储明细数据,且数据可支持合计、覆盖;DSO常用于存储数据,抽取性能优于CUBE。

CUBE( InfoCube 结构 ):存储汇总后的数据,且数据只支持合计;CUBE用于建立报表。

 数据直接抽取到CUBE,传输会很慢,并且不能查看明细数据,DSO可以将业务数据分散,数据压力小。

 (3)、数据存储

PSA可以存储原始源数据,InfoCube可存储汇总数据,DataStore对象三种类型。

 

  (3)、创建数据存储对象( DataStore Object )

 十、Composite Provider -- 复合提供者

在CompositeProvider中,可以在SAP HANA中使用union和join将BW InfoProviders(或其中的数据)与SAP HANA视图中的数据合并。如果从CompositeProvider生成SAP HANA视图,则可以获得对数据的SQL访问。对于使用union操作的CompositeProvider,支持通过DTP进行增量提取。

限制:只支持输入参数,不支持变量;对于有嵌套、有组织的CompositeProvider会有一些限制,不支持从BW InfoProviders生成的聚合级别SAP HANA视图,DataStore对象,Open ODS视图,InfoObject

十一、处理链

处理链是能自动完成数据的处理和加载等操作的自动化工具。

十二、Query

位于BW架构的最顶层,用来支持最后的数据结果显示,或者生成BO中所有的universe,总之,query是BW的重点产物。

十三、InfoProvider

BW中通过InfoProvider来和Query直接相连,为其提供数据。DSO、Cube、MultiCube都可以作为infoprovider。

  • 3
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SAP BW APD,即SAP商业仓库高级过程设计器,是SAP BW系统中的一个重要工具。它提供了一个灵活而强大的方式来处理和转换大量数据。 SAP BW APD允许用户在SAP BW系统中创建、编辑和执行高级数据处理(AP)过程。通过APD,用户可以定义和执行各种数据处理任务,包括数据抽取、数据转换、数据合并和数据加载等。 APD的特点之一是它的灵活性。用户可以使用APD来设计各种数据处理过程,根据特定的业务需求进行定制。APD提供了多个数据处理和转换函数,如过滤、合并、聚合和计算等。用户可以根据需要选择和组合这些函数,以实现所需的数据处理逻辑。 此外,APD还具有强大的性能优化功能。它可以通过并行处理、数据分区和存储器优化等技术,提高数据处理的效率和速度。这对于处理大规模数据时非常重要,可以节省时间和资源。 通过APD,用户可以将处理过的数据加载到SAP BW系统的数据目标中,如数据存储器或数据目标对象。用户可以选择将数据直接加载到物理表中,也可以加载到临时表中进行后续处理。所有这些功能使APD成为一个强大的数据处理工具,能够满足各种数据处理需求。 总之,SAP BW APD是SAP BW系统中的一个重要组件,可为用户提供灵活、高效和强大的数据处理功能。它能够处理和转换大量的数据,并将处理结果加载到数据目标中。无论是数据抽取、转换还是加载,APD都能够满足用户的需求,并提供优化的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值