一、目的
在实际的团队开发过程中,不可能将自己的转换、作业和调度等配置存放在自己的电脑中,所以kettle提供资源库的方式,供我们将转换、作业等存储下来,构成一种协作平台。
Kettle支持的资源库类型有三种:
1.Pentaho Repository:使用的是Kettle公司自己的服务器,一般自己公司不会使用
2.Database Repository:保存在数据库的资源库,通过用户名密码访问
3.File Repository:保存的服务器硬盘的资源库,不用密码就可以使用
在实际的项目开发中,我们一般选择Database Repository方式
二、实施步骤
(一、二)打开kettle,点击Connect——Other Repository
(三、四)点击Database Repository——Get Started
(五)连接数据库
(六)点击Create New Connection创建数据库(建议MySQL数据库)
注意:kettle创建共享资源库后会在选择连接的数据库中自动建一堆表,因此建议提前准备一个db_kettle数据库,专门生成kettle的表
(七)数据库建好后点击back(只需要一个db_kettle的数据库即可)
(八)输入资源库名字——选择连接数据库——勾选下方Launch connection on startup——点击Finish
然后,需要等待
(九)创建成功后点击Connect Now
(十)登录资源库 账号和密码默认都是admin
(十一)连接成功
到这里,kettle创建共享资源库的创建部分就结束了,剩下的实际操作部分还需要进一步研究。
在真实项目里,截至这里基本可以创建并执行kettle任务,可是kettle任务如果想要在项目中调度跑起来,还需要在Linux中安装kettle和carte服务!!!
这也是我下一步要探索和研究的地方,后续研究依然会写进博客里,一起加油!