kettle是什么
kettle是一款国外开源免费的数据清洗工具,是一款ETL工具,java编写,可以在Windows、Linux、Unix上运行,支持多种数据库格式,绿色无需安装,数据抽取高效稳定
Kettle中有两种脚本文件:transformation和job(transformation完成针对数据的基础转换,job则完成整个工作流的控制)
kettle的核心组件:
名称 | 描述 |
spoon | 通过图形接口,用于编辑作业和转换的桌面应用 |
pan | 一个独立的命令行程序,用于执行由spoon编辑的转换和作业 |
kitchen | 一个独立的命令行程序,用于执行由spoon编辑的作业 |
carte | 一个轻量级的WEB容器,用于建立专用,远程的ETLserver |
更详细的概念说明请查询kettle中文网:https://www.kettle.net.cn/2794.html
压缩包下载
快速下载网站,北京理工大学开源软件镜像服务网站下载地址:http://mirror.bit.edu.cn/pentaho/
下载对应的pdi开头的压缩包,实例下载为7.1版本(因为kettle现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)
配置使用
解压zip压缩包得到目录
打开软件
我使用的系统是windows10,点击data-integration目录下的spoon.bat打开即可
配置mysql数据库
1.创建一个转换,点击"工具"-->"向导"-->"创建数据库连接向导"
a
点击测试数据库连接报错:
解决办法,安装mysql驱动
Mysql官网下载驱动:https://dev.mysql.com/downloads/connector/j/
下载后解压安装包
将文件mysql-connector-java-5.1.49-bin.jar拷贝到%PATH%\data-integration\lib下,重启spoon.bat,重新配置mysql即可
2.使用编辑转换的”表输入“或”表输出“的方式创建数据库
测试成功即可完成
如果报错,参照上述方法,安装mysql驱动即可解决
-----------日常记录---------------