kettle案例23-拆分字段

针对系统操作日志的管理混乱问题,通过拆分字段组件,从'系统操作日志.xls'中提取出用户ID、操作时间、操作内容和IP地址等关键信息,实现日志内容的规范化和便捷浏览。配置了拆分字段的参数,包括分隔符、新字段定义及其数据类型等,有效地整理了日志数据。
摘要由CSDN通过智能技术生成

在工作中经常将数据导出并备份到文件中,这时文件的数据由于没有数据库系统的规范字段格式管理,数据显得很乱,也很不方便管理。

为了方便浏览日志内容,需要在某软件系统的操作日志“系统操作日志.xls”文件中,采用拆分字段组件,从日志内容中拆分出用户ID、操作时间、操作内容和IP地址字段,并对应到相关的数据。

 

 

参数设置:

参数名称

说明

基础参数

步骤名称

表示拆分字段组件名称,在单个转换工程中,名称必须唯一。默认值为【拆分字段】组件名称

需要拆分的字段

表示要拆分字段的名称。默认值为空

分隔符

表示确定字段的分隔符。特殊字符(CHAR ASCII HEX01)可以用$[value]格式设置,如$[01]$[6F,FF,00,1F]。默认值为“,”英文逗号

Enclosure

ignore delimiters within paris enclosureleave blank of none

表示忽略括号内的分隔符。默认值为空

字段

表示拆分的新字段名称,使用【字段】表,设置新字段参数。对于新字段,必须定义字段名称、数据类型和其他属性,【字段】表参数说明如下表所示。默认值为空

 

参数名称

说明

新的字段

表示拆分出的新的字段名称。默认值为空

ID

表示给拆分出新字段的ID编号,方便移除字段时使用。默认值为空

移除ID?

表示是否要移除该编号的的字段,选项有YN。默认值为空

类型

表示字段的数据类型。类型选项有:BigNumberBinaryBooleanDateIntegerInternet AddressNumberStringTimestamp。默认值为空

长度

表示字段长度。默认值为空

精度

表示数字类型字段的浮点数的精确位数。默认值为空

格式

表示转换时,原始字段格式的可选掩码。有关使用的公共有效日期和数字格式的信息,请参阅有关公共格式参考书。默认值为空

分组符号

表示数值分组符号,一般使用“,”英文逗号表示。默认值为空

小数符号

表示小数点符号,一般使用“.”英文点号。默认值为空

货币符号

表示货币符号,例如“¥”“$”“€”等货币符号。默认值为空

Nullif

表示Nullif名称,默认值为空

缺省

表示缺省值。默认值为空

去除空格类型

表示去除空格的类型,选项有不去掉空格、去掉左空格、去掉右空格、去掉左右两端空格。默认值为不去掉空格

执行结果: 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值