ETL-kettle-1.基本配置

作为自己学习的一点记录:

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少。
在使用中我感觉这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率。

1、Kettle概念

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

2、下载和部署

žKettle可以在官网下载
ž
一、电脑要先安装JDK、数据库(这里也不写了,最基本的)
(待补充)

二、去kettle官网去下载(官网:http://kettle.pentaho.org/)
kettle是开源、绿色,所以解压缩到任意路径都可以。在这里插入图片描述
我下载的是8.2的版本,其实任何版本都可以的。
在这里插入图片描述
解压
在这里插入图片描述
三、运行
Windows:
Windows系统下的话 直接双击Spoon.bat就可以运行了
MAC:
我用的是mac 就得使用终端进入目录然后在用命令 sh spoon.sh 就可以运行了
在这里插入图片描述
然后就可以看到kettle了。
在这里插入图片描述
四、新建一个作业
点击左上角的+ 选择作业 在这里插入图片描述

五、新建一个连接
在这里插入图片描述
这里我用的是Oracle数据库,MySQL数据库的话填写的信息应该会比这个少
如果数据库是安装在本地的话 主机名称应该填写localhost
建议填写之后点击测试 后在确认 如果是错误的话,到后面会检索表数据的时候会卡半天
别问我是怎么知道的?

在这里插入图片描述

出现错误:
在这里插入图片描述
原因:缺少连接数据库的jar包

解决办法:找到相应数据库的jar包 copy到kettle安装目录\lib 下面。重新运行spoon程序。即可解决
Oracle:$ORACLE_HOME\jdbc\lib下的ojdbc*.jar包
在这里插入图片描述
再次打开,完美连接
在这里插入图片描述
OK 安静的躺在这里了

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值