kettle 获取指定文件_kettle读取文件目录下的数据结构一致的所有数据文件信息和内容...

最新推荐文章于 2024-07-31 11:18:40 发布

kingtisen

最新推荐文章于 2024-07-31 11:18:40 发布

阅读量3k

点赞数

文章标签： kettle 获取指定文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35227213/article/details/112834312

版权

本文介绍了如何使用Kettle的Get File Names和Text Input步骤读取文件目录下数据结构一致的txt文件信息和内容。通过设置正则表达式筛选特定文件，然后利用Text Input步骤读取文件内容。

摘要由CSDN通过智能技术生成

为了避免文本文件在导出的数据时过大，分别导出在多个文件文本中。怎么利用kettle读取文件目录下的数据结构一致的所有数据文件信息和内容？如下图所示：

其实在kettle中有step为Get File Names 和Text Input两个步骤，可以通过设置这两个步骤的属性来实现在文件目录下读取指定文件后缀名的文件的信息和数据。

通过这样的设置文件信息(文件名，大小，路径等)可以是一个流变量 ( Stream Variable)，并且从上一个步骤中获取相应的值，这样就提供了无限的灵活性；

具体的属性设置如下：

Get File Names:选择一个文件目录，并设定目录下文件名的正则表达式。这里选择的是txt类型数据文件，因此正则表达式设为customers-.*\.txt$，选取F：\test目录下所有customers-开头并且后缀为.txt的文件

文本文件输入：下方从上一步骤获取文件名，步骤读取的文件名来自Get File Names步骤，在输入里的字段被当作文件名填写Get File Names输出的字段uri。

若是单纯的读取文件目录下指定文件数据，就不需要那么麻烦设置，直接在文本文件输入步骤中文件和规则表达式中按上图所示填写就可以了。

这里需要说明通过这种设置后文本文件输入中字段选项无法自动获取字段。不过可以先不设置从前一步骤获取文件名，利用这个步骤的自身属性先获取字段，然后再设置。

附：Pentaho Kettle Steps: Get File Names

获取文件相关信息字段信息如下

filename - 包括文件名称以及扩展名，以及文件路径的整体

short_filename - 仅仅包括文件名称以及扩展名称

path - 仅仅包括文件的路径

type ——类型：file/folder

exists

ishidden ——是否隐藏

isreadable ——是否只读

iswriteable ——是否可写

lastmodifiedtime —— 修改时间

size ——大小

extension ——扩展名

uri ——文件/目录的绝对路径

rooturi ——根路径

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。