ETL数据流程处理经常会有转换中数据分支的用法,DMETL4中是如何实现流程数据分支的呢?
1. DMETL4的流程分支是在输出配置上配置的
上图是默认输出,即只有一条数据流出线路,未做任何分支;
2. 分支可配合过滤条件使用,也可不使用过滤条件;
上图是不使用条件进行分支方法,一般用于数据分发到不同的目的端,需要得到同一份数据;
上图转换是配置了2条不同条件分支的转换流程,即按条件分流到不同的目的端;
下面看看条件分支的配置方法如图:
上面2图分别是“70后”和“80后”两个流程条件分支,分支条件分布是
70后:left(BIRTHDATE,4)>=1970&&left(BIRTHDATE,4)<1980
80后:left(BIRTHDATE,4)>=1980&&left(BIRTHDATE,4)<1990
看看执行效果:
源数据:
可以看到有2位70后,6位80后,执行后的结果如下图:
可以看到数据条数是符合预期的。
解释一下关于条件分支的几个名词:
前过滤:只能使用默认列作为条件过滤
后过滤:可以使用派生列和默认列经过计算后的列(可能值类型已经改变)