ETL
文章平均质量分 96
本系列主要基于kettle使用,以及smart-kettle的部署更新教程,系统更新了smart_kettle数据库更新为mysql8的过程,同时介绍了资源定时调度的基本使用,操作界面为web界面,可部署在linux上面。
最强菜鸟
崇尚绝对的实力
展开
-
Kettle系列(二)smart-kettle本地离线部署
kettle先说明一下什么是kettle,相信做过数据清洗的观众应该对这个工具不陌生,它是用于数据清洗的很常见的开源的工具,官方的解释如下Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定 (数据迁移工具)。Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。通俗点讲就是一个平时用于数据治理方面的工具,例如数据同步、数据迁移、数据清洗等。原创 2023-08-14 00:23:14 · 3654 阅读 · 3 评论 -
Kettle系列(一)下载安装与基础配置
以上就是kettle的下载与配置的内容,其中重点记录了如何在kettle里面连接数据库,以mysql8为例进行了测试,测试的kettle版本有9.0和9.4,其中9.0的配置会比较繁琐一点,上文只是简单结束了一下kettle的配置,至于后面kettle的其他知识,包括怎么进行清洗,连接数据库资源库进行数据的入库操作等,以后有时间再更新。原创 2023-08-13 17:54:48 · 7919 阅读 · 4 评论