本文我们将陆续介绍有关于MS SQL Server 2005 的SSIS(SQL Server Integration Services),它和其他的ETL工具,如Informatic 在对ETL的处理手法上大同小异,区别不大,都是按照ETL和DW的概念来开发和使用的。
SSIS的流程中主要分为几个部分:控制流,数据流,日志消息和事件处理,以及包配置还有执行结果查看器。
控制流
控制流只要是对执行流程中任务的控制,比如循环控制,顺序控制,还有条件控制。
循环控制如:forch 任务或者for 任务,一个是枚举型的,一个是顺序循环
顺序控制如:如一般的处理任务
条件控制,是指可以对大部分任务的执行后的流程流向,如果按照变量或者执行的成功或者失败来就行控制。
如下图:
容器类型
提供四种用于生成包的容器。下表列出了容器类型。
包和事件处理程序也是容器类型。
数据流
数据流:如下图,主要是用来定义数据从源到目标的过程,中间包含数据的转换,查找,分类等等
目标数据源
以下关系图显示的数据流具有一个源、带有一个输入和一个输出的转换以及一个目标。除了输入列、输出列和外部列之外,该关系图还包含输入、输出和错误输出。
转换
商业智能转换
下列转换执行商业智能操作,如清除数据、挖掘文本以及运行数据挖掘预测查询。
行转换
下列转换更新列值并创建新列。转换应用于转换输入中的每个行。
行集转换
下列转换将创建新行集。行集可以包括聚合值和已排序值、样本行集或者透视行集和逆透视行集。
SSIS的流程中主要分为几个部分:控制流,数据流,日志消息和事件处理,以及包配置还有执行结果查看器。
控制流
控制流只要是对执行流程中任务的控制,比如循环控制,顺序控制,还有条件控制。
循环控制如:forch 任务或者for 任务,一个是枚举型的,一个是顺序循环
顺序控制如:如一般的处理任务
条件控制,是指可以对大部分任务的执行后的流程流向,如果按照变量或者执行的成功或者失败来就行控制。
如下图:
容器类型
提供四种用于生成包的容器。下表列出了容器类型。
包和事件处理程序也是容器类型。
数据流
数据流:如下图,主要是用来定义数据从源到目标的过程,中间包含数据的转换,查找,分类等等
目标数据源
以下关系图显示的数据流具有一个源、带有一个输入和一个输出的转换以及一个目标。除了输入列、输出列和外部列之外,该关系图还包含输入、输出和错误输出。
转换
商业智能转换
下列转换执行商业智能操作,如清除数据、挖掘文本以及运行数据挖掘预测查询。
行转换
下列转换更新列值并创建新列。转换应用于转换输入中的每个行。
行集转换
下列转换将创建新行集。行集可以包括聚合值和已排序值、样本行集或者透视行集和逆透视行集。