kettle中止是怎么用的_kettle-数据源配置化-开发、生产采用不同配置

数据etl常用工具kettle。

1、说明:

kettle-数据源配置化:是指kettle的数据源连接信息全部或者部分从配置文件中读取(如果是数据库的资源库,那么资源库也可以配置化)。

2、优点:

1、这样程序本身就和kettle的业务解绑了,开发、生产采用不同配置;每次开发完成就可以直接导入线上,再也不用手动去修改连接信息(少改少错,不改就不错)。

2、可以对开发人员保密线上的连接信息,保证数据安全。

在开发和部署的时候不用再关心线上、开发、测试环境的数据源不一样,每次上线需要手动修改的麻烦。

3、资源库的方式有2种:

(1)、文件方式。方便迁移、分布式环境下需要自己解决文件同步。

(2)、数据库方式。会有数据库锁的问题。不用维护文件同步问题。集群部署支持好。

(3)、读取配置文件的方式,对上面2中资源库类型都是支持的,没有影响。

数据库方式的资源库中的数据源连接信息,也可以从配置文件读取(共享的数据源、非共享的数据源都可以)。

4、kettle配置文件的位置:

windows 默认在:C:\Users\用户\.kettle

linux 默认在:/root/.kettle/

5、配置文件:

下图是kettle的三个核心配置文件。依次是配置信息文件、资源库配置文件、共享数据源配置文件

8b7f67122658105146f9a9e783965ff7.png

6、我们在kettle界面上看看具体的配置是怎么样的

(1)、资源库的连接信息:从配置文件中读取

02d02cafe1eb2bcb1f396093247444af.png

(2)、数据源的连接信息:从配置文件中读取

ee144465b6e19c76570870032bc30628.png

(3)、hadoop的连接信息:从配置文件中读取

196cd31f5c697b71eecf2d8962bd3710.png

7、下面分别看一下三个文件的内容

(1)、配置信息文件

这里特别说明:配置好之后,线上、线下只有这个配置文件的内容不一样。其他配置都是一样的。这样在开发好之后可以直接导入线上。连数据源、资源库的连接名都不用改。

1e2c3d7c9880462781ce0b1723a6829c.png

(2)、资源库配置文件

d8247f4903c7beec1586d2ef9d3b2205.png

(3)、共享数据源配置文件

如果没有配置共享数据源,则这个文件是空的,如果有,跟上图的连接信息类似。

ba094a54b35e2bd33b9baf07076dbeee.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值