ETL工具—kettle使用之二

       这一篇开始进入kettle的一些常用插件的使用介绍,通过实例介绍不同插件的功能。这一篇主要讲的是Data Grid和文本文件输出的使用。

文本文件输出介绍(可以略过,一般用不着):

       1、Run this as a command instead:把结果输出到命令行或者脚本
       2、文件名里包含步骤数:如果你在多个拷贝中运行步骤,拷贝的数量将包含到文件名中。
       3、Include partition nr in filename:文件名中包含数据分区数量
       4、文件名包含日期
       5、文件名包含时间
       6、追加
       7、分隔符
       8、封闭符:封闭字段的一对字符,可选
       9、强制在字段周围加上封闭符
       10、头部:如果享有一个头部行,选中
       11、尾部:如果享有一个尾部行,选中
       12、格式:DOS文件的分隔符可以是回车或换行符
       13、编码:指定编码,如果空白就是用系统缺省的编码
       14、Compression(压缩):指定压缩的类型(zip,gzip)
       15、Right pad fields:在字段最后添加空格或者删除字符,直到长度达到指定
       16、Fast data dump(no formatting):当处理大量数据到一个文本文件时,提高性能.(不包含任何格式化信息)
       17、分拆每一行:如果n比0大,用n行拆分文本文件,分割成多个部分。
       18、Add Ending line of file:指定输出文本的额结束行。

具体操作:

       首先,启动软件,新建转换作业,如下图:


       其次,就可以在空白区域拖拽插件进行数据对接了,我们先做个测试表数据输出到文本文件中,用到的插件有Data Grid文本文件输出,如下图:

       打开Data Grid并编辑测试

        打开文本文件输出并自动获取字段和编辑输出路径,如下图:

       上面看到的只是一些最基本的操作,想要个性化的配置需要对每个插件里的配置项进行配置,弄好之后我们就可以点击运行按钮了(记得一定要先保存哦),看输出结果,如下图:

 

      运行后我们可以看到还有输出日志,还有每一步执行的结果显示输出,方便我们查看,最后的运行结果会在指定好的路径创建出一个文本文件,打开文件如下图所示:

       


       这一篇就到这里,下篇我们继续演示其它插件的使用…

参考来源:https://yq.aliyun.com/articles/38086?spm=5176.100240.searchblog.26.HOy1bK
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值