kettle案例19-字段选择

数据文件中有些字段全是数字,如电话号码字段会被系统当成浮点型处理,有些字段在某个场景里用不上,也有个别字段使用了不恰当或错误的名称。对于这些问题,都需要对相应的字段进行改变类型、去除字段和改变名称等字段处理。

为了统计语文、数学和英语3门基础学科的分数,需要对某年级的“2018年4月月考成绩.xls”文件,使用【字段选择】组件,选择语文、数学和英语字段,并且把创建时间改为考试时间。

选择和修改选项卡参数

参数名称

说明

字段

表示要选择和修改字段,使用一个字段表设置有关字段参数。字段参数如下

1. 字段名称:要选择和修改的字段名称,可以单击【获取选择的字段】按钮,获取输入流字段名称。默认值为空
2. 改名成:字段改名后的目标名称,如果不希望改名,那么为空。默认值为空
3. 长度:字段的长度。默认值为空
4. 精度:数字类型字段的浮点数的精确位数。默认值为空

包含未指定列,按名称排序

是否包含输入流中未在字段表中显式选择的字段

 元数据参数选项卡

参数名称

说明

字段名称

表示需要改变元数据的字段的名称。可以通过【获取改变的字段】或直接使用键盘设置。默认值为空

改名成

表示字段改名后的目标名称,如果不希望改名,那么为空。默认值为空

类型

表示字段的数据类型。类型选项有:BigNumberBinaryBooleanDateIntegerInternet AddressNumberStringTimestamp。默认值为空

长度

表示字段长度。默认值为空

精度

表示数字类型字段的浮点数的精确位数。默认值为空

Binary to Normal?

表示是否将字符串转换为数字数据类型,选项有是、否。默认值为空

格式

表示转换时,原始字段格式的可选掩码。有关公共有效日期和数字格式的信息,请参阅有关公共格式参考书。默认值为空

参数名称

说明

Date Format Lenient?

表示日期格式解析器是否是严格还是宽松的。选项有是、否。设置为“是”时,只接受严格有效的日期值;设置为“否”时,解析器会尝试把错误日期纠正为正确的日期。默认值为空

Date Locale

表示日期地区区域。为空时,以系统上默认日期区域编码设置。默认值为空

Date Time Zone

表示日期时区。为空时,以系统上默认日期日期编码设置。默认值为空

Lenient number conversion?

表示数字转换是否是宽松的。选项有是、否。设置为“是”时,将解析数字,直到找到一个非数字值,如破折号或斜杠,解析然后停止,不报告错误。当设置为“否”时,如果输入的数字无效,解析器将报告错误。默认值为空

Encoding

表示文本文件编码。为空时,以在系统上使用默认编码。从系统上提供的编码列表中选择。默认值为空

分组

表示数值分组符号,一般使用“,”英文逗号。默认值为空

货币符号

表示货币符号,例如“¥”“$”“€”等货币符号。默认值为空

执行结果:

 

  • 3
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值