[Kettle] 字段处理

1.增加常量

常量是指在计算机程序运行过程中其值不能改变的量

常量可以是任何的数据类型,例如,圆周率"3.141159"、中国首都"北京"等都可以是常量

增加常量是指在数据中增加一个字段,并给字段设置一个固定的值

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了方便统计学生考试的平均分数,需要在某年级的"2018年上学期期末考试成绩.xls"文件中,使用增加常量组件,增加"考试课程数"字段,并设置值为"6"

1.1 建立【增加常量】转换工程

使用Ctrl+N快捷键,创建【增加常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,没有"考试课程数"字段

在【增加常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,在【核心对象】选项卡中,选中【增加常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【增加常量】组件,建立节点连接,如下图所示

1.2 设置【增加常量】组件参数

双击【增加常量】组件,弹出创建【增加常量】对话框,如下图所示

【增加常量】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加常量组件名称,在单个转换工程中,名称必须唯一

默认值为【增加常量】组件名称

名称表示增加常量的字段名称,默认值为空
类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

格式

表示转换时,原始字段格式的可选掩码。使用公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
当前的表示是否对当前记录处理,默认值为空
10进制的表示数字类型字段是否为10进制,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
表示增加常量字段的值,默认值为空
设为空串表示是否设为空字符串,默认值为空

在【增加常量】对话框中,因为学生考试课程数都是一样的,所以增加"考试课程数"字段,并设置值为"6",操作步骤如下

(1) 确定组件名称,保留【增加常量】默认值为"增加常量"

(2) 设置增加常量的字段参数,对【字段】参数进行设置

此时完成【增加常量】组件参数的设置如下图所示

1.3 预览结果数据

在【增加常量】转换工程中,单击【增加常量】组件,再单击工作区上方的"预览这个转换"图标,预览增加常量后的数据,如下图所示

2.将字段值设置为常量

增加常量是增加字段,并给该字段赋值,与增加常量类似,将字段值设置为常量,是对现有的字段,重新赋一个新的固定值

数据源

2018年上学期期末语数英考试成绩(Kettle数据集10).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537546?spm=1001.2014.3001.5501需求:为了统计课程考试的平均分数,需要在"2018年上学期期末语数英考试成绩.xls"文件中,对其中数据为空的"基础课程数"字段,采用将字段值设置为常量组件,设置"基础课程数"字段的数据为"3",表示语文、数学和英语等3门基础课程数

2.1 建立【将字段值设置为常量】转换工程

使用Ctrl+N快捷键,创建【将字段值设置为常量】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末语数英考试成绩.xls"文件,预览数据,如下图所示,发现"基础课程数"数据为<null>

在【将字段值设置为常量】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【将字段值设置为常量】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【将字段值设置为常量】组件,建立节点连接,如下图所示

2.2 设置【将字段值设置为常量】组件参数

在【将字段值设置为常量】转换工程中,双击【将字段值设置为常量】组件,弹出创建【将字段值设置为常量】对话框,如下图所示

【将字段值设置为常量】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示将字段值设置为常量组件名称,在单个转换工程中,名称必须唯一

默认值为【将字段值设置为常量】组件名称

在常量中使用变量表示常量是否使用变量的值,默认值为空
名称表示将字段值设置为常量的字段名称,默认值为空
值替换表示替换数据的值,默认值为空

转换掩码(对日期型)

表示转换时,对于日期型字段,采用的可选掩码。有关使用的公共有效日期和数字格式的信息,请参阅有关公共格式参考书

默认值为空

设为空串

表示是否设置为空串,选项为:是、否

默认值为空

在【将字段值设置为常量】对话框中,对于所有的考生,基础课程数都是3门,将"基础课程数"字段设置为"3",步骤如下

(1) 确定组件名称,保留【将字段值设置为常量】参数默认值"将字段值设置为常量"

(2) 设置将字段值设置为常量的字段参数,对【字段】表参数进行设置

此时完成【将字段值设置为常量】组件参数的设置如下图所示

2.3 预览结果数据

在【将字段值设置为常量】转换工程中,单击【将字段值设置为常量】组件,再单击工作区上方的"预览这个转换"图标,预览将字段值设置为常量后的数据,如下图所示

3.剪切字符串

字符串(String)是由数字、字母和下划线等组成、由一对英文双引号或单引号包括起来的用于表示文本的数据类型

剪切字符串,就是在字符串中,去除多余的内容,保留需要的内容,例如在"Hello,World!"字符串中,只保留"Hello",而剪除其余部分

数据源

2018年12月月考成绩(Kettle数据集11).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537857?spm=1001.2014.3001.5501需求:为了简化数据,需要在"2018年12月月考考试成绩.xls"文件中,采用剪切字符串组件,使"考试时间"字段只保留年月的数据

3.1 建立【剪切字符串】转换工程

使用Ctrl+N快捷键,创建【剪切字符串】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年12月月考考试成绩.xls"文件,注意在设置字段参数中,"考试时间"字段由"Date"日期型设置为"String"字符串类型,格式设置为"yyyy-MM-dd HH:mm:ss",以便进行字符串剪切,如下图所示

预览数据,如下图所示,发现当前数据中,"考试时间"字段数据为完整的年月日和具体时间 

在【剪切字符串】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【剪切字符串】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【剪切字符串】组件,建立节点连接,如下图所示

3.2 设置【剪切字符串】组件参数

双击【剪切字符串】组件,弹出创建【剪切字符串】对话框,如下图所示

【剪切字符串】组件的有关参数说明如下表所示

参数名称说明

步骤名称

表示剪切字符串组件名称,在单个转换工程中,名称必须唯一

默认值为【剪切字符串】组件名称

输入流字段要剪切的字段名称,默认值为空
输出流字段剪切后的新字段名称,默认值为空
起始位置表示剪切的起始位置,位置从0开始计算,默认值为空
结束位置表示结束对字符串剪切的位置,默认值为空

在【剪切字符串】对话框中,月考的考试时间只需保留年月即可,步骤如下

(1) 确定组件名称,保留【剪切字符串】参数为默认值"将字段值设置为常量"

(2)  设置要剪切的字符串字段的参数,对【要剪切的字段】参数进行设置

此时完成【剪切字符串】组件参数的设置如下图所示

3.3 预览结果数据

在【剪切字符串】转换工程中,单击【剪切字符串】组件,再单击工作区上方的"预览这个转换"图标,预览剪切字符串后的数据,如下图所示 

4.拆分字段

数据源

系统操作日志(Kettle数据集12).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88538593?spm=1001.2014.3001.5501需求:为了方便浏览日志内容,需要在某软件系统的操作日志"系统操作日志.xls"文件中,采用拆分字段组件,从日志内容中拆分出用户ID、操作时间、操作内容和IP地址字段,并对应到相关的数据

4.1 建立【拆分字段】转换工程

使用Ctrl+N快捷键,创建【拆分字段】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"系统操作日志.xls"文件,预览数据,如下图所示,只有一个"系统日志"字段,内容显得很乱

在【拆分字段】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【拆分字段】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【拆分字段】组件,建立节点连接,如下图所示

4.2 设置【拆分字段】组件参数

双击【拆分字段】组件,弹出创建【拆分字段】对话框,如下图所示

【拆分字段】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示拆分字段组件名称,在单个转换工程中,名称必须唯一

默认值为【拆分字段】组件名称

需要拆分的字段表示要拆分字段的名称,默认值为空
分隔符

表示确定字段的分隔符

特殊字符(如CHAR ASCII HEX01)可以用$[value]格式设置,如$[01]或$[6F,FF,00,1F]

默认值为","英文逗号

Enclosureignore delimiters within paris enclosure(leave blank of none)
字段

表示拆分的新字段名称,使用【字段】表,设置新字段参数。对于新字段,必须定义字段名称、数据类型和其他属性

默认值为空

新的字段表示拆分出的新的字段名称,默认值为空

ID

表示给拆分出新字段的ID编号,方便移除字段时使用,默认值为空

移除ID?

表示是否要移除该编号的的字段,选项有Y、N

默认值为空

类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
格式

表示转换时,原始字段格式的可选掩码

默认值为空

分组符号

表示数值分组符号,一般使用","英文逗号表示

默认值为空

小数符号

表示小数点符号,一般使用"."英文点号

默认值为空

货币符号

表示货币符号,例如"¥","$","€"等货币符号

默认值为空

Nullif

表示Nullif名称,默认值为空
缺省表示缺省值,默认值为空

去除空格类型

表示去除空格的类型,选项有不去掉空格、去掉左空格、去掉右空格、去掉左右两端空格

默认值为不去掉空格

在【拆分字段】对话框中,设置参数,从操作日志数据中分拆出用户ID、操作时间、操作内容和IP地址等字段数据,步骤如下 

(1) 设置【拆分字段】组件名称,【步骤名称】参数保留默认值"拆分字段"

(2) 确定需要拆分的字段名称以及内容分隔符,【需要拆分的字段】参数设置为"系统日志";保留【分隔符】默认值","英文逗号

(3) 设置拆分后新字段参数,对要拆分的字段参数进行设置,【新的字段】【移除ID?】【类型】参数的设置如图所示,【去除空格类型】参数统一设为"不去掉空格"

此时完成【拆分字段】组件参数的设置如下图所示

4.3 预览结果数据

在【拆分字段】转换工程中,单击【拆分字段】组件,再单击工作区上方的"预览这个转换"图标,预览拆分字段后的数据,如下图所示

5.数值范围

数值范围是给定下限和上界数值的区间范围,划分出多个数值范围

数据源

2019年10月月考英语成绩(Kettle数据集5).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88529906?spm=1001.2014.3001.5501需求:为了解学生分数的分布情况,需要在"2019年10月月考英语成绩.xls"文件中,使用数值范围组件,对英语分数划分范围,以便统计各范围区间的人数:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分

5.1 建立【数值范围】转换工程

使用Ctrl+N快捷键,创建【数值范围】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年10月月考英语成绩.xls"文件,预览数据,如下图所示

在【数值范围】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【数值范围】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【数值范围】组件,建立节点连接,如下图所示 

5.2 设置【数值范围】组件参数

双击【数值范围】组件,弹出【数值范围】对话框,如下图所示

【数值范围】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示数值范围的组件名称,在单个转换工程中,名称必须唯一

默认值为【数值范围】的组件名称

输入字段

表示要对其划分数值范围的输入流数值型字段,在输入流字段列表中选取

默认值为空

输出字段表示划分数值范围的新字段名称,默认值为range
缺省值(如果没有匹配到的范围)

表示要划分数值范围的字段数据,没有在划分的范围内的值

默认值为unknown

范围 (最小<=X<最大)

表示要划分的设置范围区间

使用一个表,分行设置多个范围,范围的参数如下:

① 下限:该范围取值的最小值(<=)
② 上界:该范围取值的最大值(<)
③ 值:该范围的名称

在【数值范围】对话框中,设置参数,对英语分数划分以下范围:小于80分、80~90分、90~100分、100~110分、100~120分、120~130分、130~140、140~150分、150分满分,步骤如下

(1) 设置【数值范围】组件名称,【步骤名称】保留默认值"数值范围"

(2) 确定划分数值范围的字段,【输入字段】设置为"英语"字段

(3) 确定输出的字段,【输出字段】设置为"分数范围"字段

(4) 确定【缺省值(如果没有匹配到的范围)】的内容,【缺省值(如果没有匹配到的范围)】设置为"不在范围内"

(5) 划分数值范围,对【范围 (最小<=X<最大)】表的参数进行设置

此时完成【数值范围】组件参数的设置如下图所示

5.3 预览结果数据

在【数值范围】转换工程中,单击【数值范围】组件,再单击工作区上方的"预览这个转换"图标,预览设置数值范围后的数据,如下图所示 

6.计算器

计算器除了进行加、减、乘和除等简单运算外,还可以进行乘方、开方、指数、对数、三角函数和统计等方面的运算

Kettle软件提供计算器组件,对数值型的字段数据进行运算

数据源

2018年上学期期末考试成绩(Kettle数据集9).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88537342?spm=1001.2014.3001.5501需求:为了详细了解学生的基础和全部课程的考试情况,需要在"2018年上学期期末考试成绩.xls"文件中,使用计算器组件,分别计算学生语文、数学和英语3门基础课程的总分数,以及全部6门课程的总分数

6.1 建立【计算器】转换工程

使用Ctrl+N快捷键,创建【计算器】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年上学期期末考试成绩.xls"文件,预览数据,如下图所示,只有各科课程分数,没有统计分数

在【计算器】转换工程,单击【核心对象】选项卡,展开【转换】对象,选中【计算器】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【计算器】组件,建立节点连接,如下图所示

6.2 设置【计算器】组件参数

双击【计算器】组件,弹出创建【计算器】对话框,如下图所示

【计算器】组件的有关参数说明如下表所示

参数名称说明
步骤名称

表示计算器组件名称,在单个转换工程中,名称必须唯一

默认值为【计算器】组件名称

Throw an error on non existing files表示文件不存在是是否抛出一个错误,默认值为√,勾选
字段表示保存计算器运算结果的新字段,使用一个【字段】表,设置新字段参数,默认值为空
新字段表示保存计算器运算结果的新字段名称,默认值为空
计算表示计算公式,从系统提供的计算公式中选择,默认值为空
字段A表示参加计算的第一个字段,从输入流中选取,也可直接键盘设置,默认值为空
字段B表示参加计算的第二字段,从输入流中选取,也可直接键盘设置,默认值为空
字段C表示参加计算的第三字段,从输入流中选取,也可直接键盘设置,默认值为空
值类型

表示字段的数据类型

类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
移除表示所在行的新字段只参加运算,不出现在输出流中
Conversion Mask表示所在行的新字段的掩码,默认值为空
小数点表示小数点符号,一般使用"."英文点号,默认值为空
分组表示数值分组符号,一般使用","英文逗号表示,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【计算器】对话框中,设置参数,统计基础课程语数英的总分数和全部6门考试课程的总分数,步骤如下

(1) 设置【计算器】组件名称,【步骤名称】保留默认值"计算器"

(2) 设置统计字段的参数,对【字段】表参数进行设置

此时完成【计算器】组件参数的设置如下图所示

6.3 预览结果数据

在【计算器】计算器工程中,单击【计算器】组件,再单击工作区上方的"预览这个转换"图标,预览使用计算器后的数据,如下图所示

7.增加序列

序列是按照一定规律次序排好的行列,有特定起始值和增量值,是不断变化的整数值行列,例如"1,2,3,4,…. ",以及"1,2,3,1,2,3,……"等都是序列

数据源

2019年11月月考数学成绩(Kettle数据集3).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88521681?spm=1001.2014.3001.5501需求:由于在"2019年11月月考数学成绩.xls"文件中,存在着重复记录,在去除重复记录后,序号不能连贯按顺序排列,需要使用增加序列组件,生成新序号,以便序号能够顺序排列

(1) 建立【增加序列】转换工程

使用Ctrl+N快捷键,创建【增加序列】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2019年11月月考数学成绩.xls"文件,接着创建【排序记录】组件,并由【Excel输入】组件指向【排序记录】组件,建立节点连接,双击【排序记录】组件,对"学号"字段按照升序进行排序后预览数据

创建【去除重复记录】组件,由【排序记录】组件指向【去除重复记录】组件,建立节点连接,设置去除重复记录参数,去除数据中的重复记录后预览数据

浏览去除重复记录后的数据如下图所示,序号数据不连续了,出现序号数据从"23"跳到"25"、从"29"跳到"31"等的情况

在【增加序列】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【增加序列】组件,并拖曳到右边工作区中,由【去除重复记录】组件指向【增加序列】组件,这时弹出包括【主输出步骤】和【错误处理步骤】选项的选项框,选择【主输出步骤】选项建立节点连接,如下图所示

(2) 设置【增加序列】组件参数

双击【增加序列】组件,弹出创建【增加序列】对话框,如下图所示

【增加序列】组件有关参数说明如下表所示

参数名称说明
步骤名称

表示增加序列组件名称,在单个转换工程中,名称必须唯一

默认值为【增加序列】组件名称

值的名称

表示增加序列的字段名称

默认值为valuename

使用DB来获取sequence表示是否使用DB来获取序列,默认值为空
数据库连接表示数据库的连接名称。默认值为空或当前工程中已经存在的数据库连接名称。也可以单击【编辑】【新建】和【Wizard】按钮编辑数据库连接
模式名称表示数据库模式名称,默认值为空
Sequence 名称表示序列名称,默认值为SEQ_
使用计数器来计算sequence表示是否使用计数器来获取序列,默认值为√
计数器名称(可选)表示计数器的名称,默认值为空
起始值表示序列起始值,默认值为1
增长根据表示序列增加或减少的步长,默认值为1
最大值表示序列的最大值,默认值为999999999

在增加序列】对话框中,使用转换计数器来生成序列,增加一个名称为"新序号"字段,表示是新增加的序列号,步骤如下

(1) 确定【增加序列】组件名称,【增加序列】采用默认值"增加序列"

(2) 设置新系列的名称,设置【值的名称】为"新序号"

(3) 使用转换计数器来生成序列数据

① 【起始值】设置为"1"

② 【增长根据】设置为"1"

③ 【最大值】采用默认值

此时完成【增加序列】组件参数设置如下图所示

(3) 预览结果数据

在【增加序列】转换工程中,单击【增加序列】组件,再单击工作区上方的"预览这个转换"图标,预览增加序列后的数据,如下图所示

8.字段选择

数据文件中有些字段全是数字,如电话号码字段会被系统当成浮点型处理,有些字段在某个场景里用不上,也有个别字段使用了不恰当或错误的名称,对于这些问题,都需要对相对应的字段进行改变类型、去除字段和改变名称等字段处理

数据源

2018年4月月考成绩(Kettle数据集13).xlsicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88550080?spm=1001.2014.3001.5501需求:为了统计语文、数学和英语3门基础学科的分数,需要对某年级的"2018年4月月考成绩.xls"文件,使用【字段选择操作】组件,选择语文、数学和英语字段,并且把创建时间改为考试时间

8.1 建立【字段选择】转换工程

使用Ctrl+N快捷键,创建【字段选择】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,设置参数,导入"2018年4月月考成绩.xls"文件,预览数据,如下图所示,"序号","学号"字段出现小数,有"创建时间"而没有"考试时间"

在【字段选择】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【字段选择】组件,并拖曳到右边工作区中,由【Excel输入】组件指向【字段选择】组件,建立节点连接,如下图所示

8.2 设置【字段选择】组件参数

双击【字段选择】组件,弹出创建【选择/改名值】对话框,如下图所示

【字段选择】组件的参数包含组件的基础参数和【选择和修改】【移除】【元数据】3个选项卡参数 

在组件的基础参数中,【步骤名称】参数表示字段选择组件的名称,在单个转换工程中,名称必须唯一,采用默认值"字段选择"

【选择和修改】选项卡参数

在【选择和修改】选项卡中,使用一个【字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段

表示要选择和修改字段,使用一个字段表设置有关字段参数,字段参数如下
① 字段名称:要选择和修改的字段名称,可以单击【获取选择的字段】按钮,获取输入流字段名称,默认值为空
② 改名成:字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
③ 长度:字段的长度,默认值为空
④ 精度:数字类型字段的浮点数的精确位数,默认值为空

包含未指定列,按名称排序是否包含输入流中未在字段表中显式选择的字段

在【选择和修改】选项卡中,对导入的"2018年4月月考成绩.xls"文件中的字段进行选择和修改,步骤如下

(1) 确定选择和修改的字段,单击【获取选择的字段】按钮,获取导入文件的所有字段,添加到【字段】表中

(2) 修改字段名称,"创建时间"字段所在行的【改名成】设置为"考试时间",需要注意的是,输入流"创建时间"字段名称已经被改名为"考试时间",该字段的【长度】【精度】参数暂时不进行设置

【移除】选项卡参数

单击【移除】选项卡,展示【移除的字段】参数表,如下图所示

在【移除的字段】参数表中设置参数,移除不需要的字段

因为只需选择3门基础课程语文、数学和英语的考试分数,所以需要设置参数移除物理、化学和生物3门课程,操作步骤如下

(1) 添加输入流字段,单击【获取移除的字段】按钮,添加输入流的字段名称到【移除的字段】参数表中

(2) 确定要移除的字段,在【移除的字段】参数表中,单击字段名称所在的行号数,右键单击选中的行,单击快捷菜单的【删除选中的行】选项,删除非移除的字段,保留要移除的字段,输入流中"物理","化学","生物"字段将被移除

【元数据】选项卡参数

单击【元数据】选项卡,展示【需要改变元数据的字段】参数表,如下图所示

在【元数据】参数选项卡中,使用【需要改变元数据的字段】参数表设置字段参数,有关参数的说明如下表所示

参数名称说明
字段名称表示需要改变元数据的字段的名称。可以通过【获取改变的字段】或直接使用键盘设置,默认值为空
改名成表示字段改名后的目标名称,如果不希望改名,那么为空,默认值为空
类型

表示字段的数据类型,类型选项有:BigNumber、Binary、Boolean、Date、Integer、Internet Address、Number、String、Timestamp

默认值为空

长度表示字段长度,默认值为空
精度表示数字类型字段的浮点数的精确位数,默认值为空
Binary to Normal?

表示是否将字符串转换为数字数据类型,选项有是、否

默认值为空

格式表示转换时,原始字段格式的可选掩码。有关公共有效日期和数字格式的信息,请参阅有关公共格式参考书。默认值为空
Date Format Lenient?

表示日期格式解析器是否是严格还是宽松的

选项有是、否

设置为"是"时,只接受严格有效的日期值;设置为"否"时,解析器会尝试把错误日期纠正为正确的日期默认值为空

Date Locale

表示日期地区区域。为空时,以系统上默认日期区域编码设置,默认值为空

Date Time Zone表示日期时区。为空时,以系统上默认日期日期编码设置,默认值为空
Lenient number conversion?表示数字转换是否是宽松的。选项有是、否。设置为"是"时,将解析数字,直到找到一个非数字值,如破折号或斜杠,解析然后停止,不报告错误。当设置为"否"时,如果输入的数字无效,解析器将报告错误,默认值为空

Encoding

表示文本文件编码。为空时,以在系统上使用默认编码。从系统上提供的编码列表中选择,默认值为空
分组表示数值分组符号,一般使用","英文逗号,默认值为空
货币符号表示货币符号,例如"¥","$","€"等货币符号,默认值为空

在【需要改变元数据的字段】参数表中,设置需要改变元数据的字段参数,步骤如下

(1) 获取源数据字段,单击【获取改变的字段】按钮,添加输入流的字段到【需要改变元数据的字段】表中

(2) 设置字段的参数

此时完成【字段选择】组件参数的设置,如下图所示

8.3 预览结果数据

在【字段选择】转换工程中,单击【字段选择】组件,再单击工作区上方的"预览这个转换"图标,预览字段选择后的数据,如图所示

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值