资源库的作用:资源库是用来保存操作步骤和相关的日志,转换,JOB 等信息。用户通过图形界面创建的的转换任务可以保存在资源库中。资源库可以是各种常见的数据库,用户通过用户名/ 密码来访问资源库中的资源,默认的用户名/ 密码是admin/admin. 资源库并不是必须的,如果没有资源库,用户还可以把转换任务保存在 xml 文件中。
转换文件以ktr为扩展名,作业文件以kjb为扩展名。

kettle的资源库包括数据库资源库和文件资源库,在文件和数据库的基础上的封装,实现org.pentaho.di.repository.Repository接口。
kettle资源库配置

1.启动Spoon.bat,点击+,弹出下图1窗口。

150210307.png

图1

2.选择this repository uses a central relational database to store ETL metadata。弹出下图2窗口

150247855.png

图2



3.选择新建,配置资源数据库。如下图3

150308979.png

图3



4点击测试,测试是否配置正确,是否能连接上资源数据库。如下图4

150356277.png

图4

5.点击OK按钮保存资源

150544973.png

图5


6.点击执行,执行sql语句在数据库中创建表和相关信息。创建完成后点击清除缓存。

150448138.png


图6


7.选择配置好的资源库,使用admin登陆。

150622808.png

图7


配置JOB,转换,日志信息就会保存到数据库中。



注意:1.点击Spoon.bat一闪而过,可能是因为没有配置KETTLE_HOME环境变量。

2.在配置资源库的数据连接时,点击测试报错如图,是因为缺少数据库连接的驱动,将对应数据库驱动的jar包放到下kettle的目录:data-integration\libext\JDBC下。 重现启动Spoon.bat

150031254.png


3.配置完资源库的数据库连接时,一定要点击创建与更新按钮,执行sql语句创建kettle需要的表结构。不创建表结构资源库无法使用,报错如图

150144755.png