使用kettle批量下载文件

最新推荐文章于 2024-08-22 10:45:50 发布

梦想画家

最新推荐文章于 2024-08-22 10:45:50 发布

阅读量1w

点赞数 2

分类专栏： pentaho 数据库 pentaho kettle 深入浅出文章标签： etl kettle 权威批量下载教程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/neweastsun/article/details/39177253

版权

数据库同时被 3 个专栏收录

105 篇文章 5 订阅

订阅专栏

37 篇文章 3 订阅

订阅专栏

pentaho kettle 深入浅出

27 篇文章 89 订阅

订阅专栏

使用kettle批量下载文件

最新有项目中需要批量下载文件并把结果导入到数据中，通过一些实验测试，kettle确实可以胜任。问题是关键是如果通过http批量下载文件，本文将详细说明，假设你已经了解了kettle的基本知识，如果需要可以查看我的系列入门教程。

本文的示例代码可以在这里下载.

主作业

kettle的转换中没有通过http下载文件的步骤，但是job的有对应的步骤，所以在主job调用子job（Download.kjb）,需要下载的文件列表通过一个转换提供。

文件列表转换

这里我仅仅使用数据表步骤提供五条记录文件，有两个字段分别为“filename”和“url”(url的内容根据你的业务需要，这里使用一个示例供测试)，为了让这些数据在download.kjb中可以访问，后面使用了job类别中“copy rows to result”步骤。

下载的作业

download作业只下载一个单独的文件，但是我们需要针对文件列表中每条记录都要运行。这里需要在作业的高级设置，选中“Execute for every input row”，实现循环调用。

在http步骤中，我们需要设置filename和url，这两个字段内容来自输入后，我们使用变量${URL}和${FILENAME}，为了使这些数据和变量关系对应，我们需要做两件事情。

1) 需要声明“URL”和“FILENAME”命名参数

在作业的属性设置，命名参数选项卡中设置。

2) 选要指定字段和变量（命名参数）的映射关系

在主作业中双击download作业步骤，然后再命名参数选项中配置映射关系。同时在主作业中定义了PATH变量，确定文件保存的位置，http步骤中使用该变量确定文件位置及名称。

结论

运行完成后，可以在c:\temp目录中可以成功下载的文件，如果把文件的结果读入到数据库，就不是难事了。有需要通过其他的文章讲解。

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

梦想画家 CSDN认证博客专家 CSDN认证企业博客

码龄22年

841: 原创

1万+: 周排名

339: 总排名

562万+: 访问

: 等级

3万+: 积分

1601: 粉丝

2925: 获赞

550: 评论

9385: 收藏

私信

关注

热门文章

分类专栏

最新评论

dbt seed 命令及应用示例
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
SQL优化必知技巧——使用exists 代替 in
Q_Z_5: 博主，假如我class_a还有附带的查询条件语法怎么写。又假如我是需要参数的形式输入list进来呢
使用Jackson处理yaml文件
香饽饽~、: 不知道为什么原来的yaml文件没有双引号，但是我写入的就有双引号，怎么能避免一下
PostgreSQL事件触发器实战教程
激动的兔子: 博主的笔触细腻，文章构思精妙，字里行间流露着不凡的文采与深邃的见解。每一句都经过精心雕琢，如同晨露微光中绽放的花朵，既清新脱俗又不失深度，引人入胜。其语言流畅而富有韵律，读来如同山间清泉，潺潺入心，让人在享受文字之美的同时，也能深刻感受到作者独到的思考与情感。总之，博主的文章是一场文字的盛宴，令人回味无穷。
PostgreSQL NUMERIC 数据类型
猿说新宇: 严格来说，precision是精度，scale是标度。精度即数的有效数字个数，比如，2.5的有效数字个数是2，但是053.2的有效数字个数是3

大家在看

最新文章

目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。