1、转换是转换里面的第四个分类。转换属于ETL的T,T就是Transform清洗、转换。ETL三个部分中,T花费时间最长,是一般情况下这部分工作量是整个ETL的2/3。
2、Concat fields,就是多个字段连接起来形成一个新的字段。
3、 值映射,就是把字段的一个值映射成其他的值。在数据质量规范上使用非常多,比如很多系统对应性别gender字段的定义不同。
4、增加常量就是在本身的数据流里面添加一列数据,该列的数据都是相同的值。
5、增加序列,是给数据流添加一个序列字段。
1、转换是转换里面的第四个分类。转换属于ETL的T,T就是Transform清洗、转换。ETL三个部分中,T花费时间最长,是一般情况下这部分工作量是整个ETL的2/3。
2、Concat fields,就是多个字段连接起来形成一个新的字段。
3、 值映射,就是把字段的一个值映射成其他的值。在数据质量规范上使用非常多,比如很多系统对应性别gender字段的定义不同。
4、增加常量就是在本身的数据流里面添加一列数据,该列的数据都是相同的值。
5、增加序列,是给数据流添加一个序列字段。