今天简单的学习了一下ETL工具kattle了,只是简单的上手,不过这也已经够我去做POC了。
首先大体介绍一下kattle,Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。因为有客户在使用这个,为了跟客户交流时不至于不懂,所有今天就稍微弄了一下,还行,基本能完成我的工作。
首先在kattle官网下载kattle,然后解压文件,打开里面的spoon.bat就可以运行它了,很简单。
现在我是有这样的需求的,需要将SQLserver的数据在不用导出的情况下直接导入到vertica中,以前也一直有这样的需求,今天刚好,稍微学习一下,以后弄起来就方便了。因为需要跟vertica和SQLserver连接,所以同时需要下载vertica的jdbc和SQLserver的jdbc,这个需要准备好,还有可能需要jtds.jar包,如果没有的话,会在使用的时候报错的。所以提前将其下载下来。具体的下载地址我就不附上了,随便搜搜就能找到。那就将今天我所整理的简单说一下。
在进行数据库连接的时候遇到一些问题,现在是解决方法:
1、sqlserver数据库
首先安装好sqlserver服务器:
为了能远程连接,在sqlserver配置管理器中需要将SQL Server browser设置为启动状态
如果无法设定,那就在服务中先将该服务设置为手动启动,再在配置管理器中启动该服务。