数据传输进程所起的作用与信息包有相似之处,都起到了触发与控制数据传输动作的作用。所不同的是,信息包控制数据从源系统到BI 系统的数据传输:而数据传输进程控制的是数据在BI 系统内部不同数据对象之间的数据传输。转换定义了BI系统中不同对象之间的数据传输、变换的规则,例如,从数据源到DSO ,从数据源到信息立方体、从DSO 到信息立方体等。作为对转换动作的控制者,数据传输进程相应地控制着不同的数据对象之间的数据传输。同时,数据传输进程也用于控制数据从BI 系统到其他外部系统的数据传输。
下面我们来介绍怎样创建一个DTP。
首先,同样右键对应数据源,点击创建DTP。然后出现下图。
记住通常我们先创建转换,然后再创建DTP。
我们看到系统自动为我们填写好了各个参数,根据我们具体需要来更改细节,通常不需要更改。
DTP Type
数据传输进程类型决定了数据传输进程不同的应用场景。数据传输进程有3 种类型。
(1) 标准的(可以计划的)数据传输进程 : 这一类型的数据传输进程的运行时间可以由用户自己定义,也可以放在处理链中自动运行。这一类型的数据传输进程可用于更新信息立方体、数据存储对象和信息对象。
(2) 实时数据获取的数据传输进程 : 这一类型的数据传输进程具有一后台监控程序,自动按设定的时间间隔将源对象的新数据发送到目标对象。这一类型的数据传输进程可用于
数据源到数据存储对象的数据传输。
(3) 直接访问的数据传输进程 : 这一类型的数据传输进程用于在目标对象运行查询时,才使用远程函数调用直接到源对象读取数据。只有在目标对象是虚拟信息提供者时才能使用
这一类型的数据传输进程。直接访问的数据传输类型得到的是源对象当前的数据,这些数据可能还没有被计划的加载进程传送到BI 系统中。
在设置好数据传输进程的类型及目标对象和源对象之后,系统进入数据传输进程的编辑界面。
上图中抽取模式,分为如下:
全量更新。如果选择了"全量更新"用户可以设定数据包的大小。包大小显示数据提取器读取的单个数据包包含的记录数。数据包的大小在提取过程中对内存消耗有间接的影响。
增量更新。如果选择了"增量更新"系统提供一个选项"仅获取增量一次。在一般情况下,不设置这一选项。如果前一次的增量数据在目标对象中被删除之后,系统在下次增量传输时,会自动将删除的数据再次进行传送,以保证数据的完整性。
下面是更新标签界面。
这里我们重点介绍下错误处理的方式。
错误处理。在这里,可以对错误数据的处理方式进行定义。错误处理定义了在进行数据传输过程中,出现错误记录时的处理方式。
在错误处理下拉列表中,定义了错误发生时,正确的数据记录是否更新。存在以下选项:
·不激活错误处理。不启用错误处理机制,一旦出现错误记录,系统会终止整个数据包的更新。这一处理方式与信息包是一样的。
·既不更新,也不用于出具报表。一旦出现错误记录,系统会终止整个数据包的更新。这个数据请求不更新到目标对象中,当然在从目标对象出具报表时,也就不能看到这些数据。系统在出错后会继续检查其他记录。
·更新正确记录,但不用于出具报表(请求状态置为"红色")。这个选项能保证正确记录的更新。但是,只有在管理员检查完那些未更新的错误记录,并手动修改请求的状态后,更新的记录才能用于出具报表。也就是说,需要管理员在监视器的"状态"选项卡中手动设置请求的状态,从红色改为绿色。
·更新正确记录,也可用于出具报表(请求状态为"绿色")。系统更新正确的记录后,在目标对象出具报表时,立即可以看到这些更新后的数据。如果系统定义了后续的动作,比如调整目标对象的聚集,系统会自动执行后续操作。
包含错误的记录被写入单独的错误堆栈。在错误堆栈中,可以手工编辑这些错误记录,并使用错误数据传输进程将这些修改后的记录更新到目标对象。
下面列出的是执行标签。
在执行一次数据传输时,系统将所有传输的数据定义为一个数据请求,同时系统将数据打包成多个数据包进行传输,所以一个数据请求中包含多个数据包。数据请求有两类状态:一是技术状态,另一个是总体状态。
SAP BI 的信息分为3 种类型:正确、警告和错误。一般来说,用绿色表示正确:用黄色表示的警告:用红色表示错误。但是对于数据请求而言,正确的状态可用于触发数据处理的后续步骤以及出具报表,错误状态的数据请求则不能。因此,对于发生警告信息的数据请求要指定一种处理方式。
其他的配置选项用户可以自己去帮助中查看。当我们信息配置好后,我们点击执行按钮。这时数据开始从PSA抽取到对应的数据对象中。
所有的数据抽取过程,SAP系统都配置了全面的监控和管理功能,就像信息包一样。DTP也有监控和管理的功能,下面我们来看一看。
数据传输进程可以手工运行,也要以在处理链中自动执行。这里,我们以手工执行为例说明如何对数据传输进程进行监控。单击"执行"按钮,系统便开始运行数据传输进程。同时,系统会弹出一对话框,询问是否显示数据传输进程运行的监控信息。选择"是"系统会自动进入数据传输进程监视器。用户也可以在任何时候,通过数据仓库工作台中“管理"功能区里的"监视器"或者单击工具栏上的监视器按钮进入监视器工作界面。
如果在数据传输进程里启用了错误数据处理,在数据传输时发生错误的数据记录及与这些记录相关的数据记录会被写到一个以数据请求方式存储的数据库表中,而不更新到目标对象中,这个存储错误记录的表就是错误堆栈。错误堆栈提供了对数据记录进行修改的功能,待数据修改正确后,再使用专门的数据传输进程,即错误数据传输进程将这些数据记录更新到目标对象中。
最后,我们对数据传输进程的4 个错误处理选项与之对应的错误处理功能做下对比。
具体详细错误堆栈等内容,请到陈永杰的SAP商务智能完全解决方案或官方的标准教材中去查看。