设定一个全空的列集合,设为cs
将所有选择和修改的列按照用户指定顺序(图1控件2)加入到cs
如果选择了包含未指定的列(图1控件5),那么将输入行集中不在cs中的所有列按照名称排序后加入cs
将移除中指定的所有列(图1控件3)从cs中删除。如果找不到,则抛出异常
将元数据中指定所有列(图1控件4),从cs中读取并修改。如果找不到,则抛出异常
以下详细解释各配置项的含义:
1、转换步骤名称:步骤的名称,在单一转换中,名称必需唯一。
2、选择和修改:指定需要保留到输出流中的字段的顺序和名称。支持修改字段名字以及长度和精度。右侧获取选择的字段按钮可以从输入行集中得到所有字段名称。列映射按钮可以从输入和输出行集建立映射关系,每一个映射将转成一行字段改名信息。由于此功能只支持输出步骤唯一,且步骤必须实现查询必备字段集合的接口,导致列映射功能用处甚微(从源码查询,实现该接口的步骤只有表输出、Access输出、XML输出、插入与更新等少量组件)。
3、移除:指定从输出流中删除的字段。
4、元数据:修改字段类型信息,每行针对一个字段。表格中各列解释如下:
字段名称:输入行集的字段名称
改名成:输出行集的新字段名称
类型:新的字段类型。下拉选择。
长度:新的字段长度,自然数。
精度:新的字段精度,自然数。一般用于Number/BigNumber类型,可以理解为小数点后精确几位。
Binary to Normal?:是否采用二进制存取文本。如果是,则读取存入性能较高。否则,正常按照类型存储。
格式:格式化字符串时需要。例如需要格式化日期与时间,那么可以用yyyy-MM-dd'T'HH:mm:ss.XXX,注意其中单引号限定部分。如果需要在日期格式中使用原始字母,那么必须用单引号限定,否则将当成表达式解析。如果是数字类型,可以用#.#或者0.00等格式,区别在于#不会填充位数,0则严格按照格式填充。
Date format Lenient?:在解析日期异常数据时是否支持宽容模式。例如碰到15月,如果启用宽容模式,那么15月会当成15-12=3月。
DateLocale:时区。一般包括语言和国家,例如中文与中国,则选择zh_CN。
DateTimeZone:时区。用在日期类型的字段,一般包含洲和城市,例如我国常用Asia/Shanghai。
Lenient number conversion?:字符串转数字是否启用宽容模式。如果启用,那么字符串中的数字尽量识别,直到遇到非数字字符为止。
Encoding:字符串编码。设置错误将导致乱码。
十进制:这里应属于翻译错误,翻译为“小数点符号”更为合适。默认情况下小数与整数部分用.分割,如果需要设置为其他符号,可以设置这个字段。注意不管设置多长的字符串,这里始终只取第一个字符作为小数点符号。
分组:分组符号,也称千位分隔符。老外的习惯,一般按照千、百万、十亿这样每三位数字一组,组之间用逗号分割。这里就是设置组之间的分隔符。
货币:货币符号,主要用在财务场景,一般放在货币金额数字的前缀或者后缀。例如人民币一般用的¥,美元一般用$,欧元一般用€。但测试下来,并没有看到设置后的效果,暂时认定为BUG。
内部供稿 CCSAII037