Kettle学习记录
1.了解什么是ETL:
Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少。kettle支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率.
2.什么是kettle:
Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
3.kettle使用:
这里简单概括一下几种具体的应用场景,按网络环境划分主要包括:
一般分为三种模式( 表视图模式 前置机模式 文件模式)【不做说明,可以百度!】
一般来说,这三种模式我们用传统的模式无疑工作量是巨大,怎么才能更高效更节省时间又不容易出错? 这就可以使用kettle
初识kettle:下载地址(https://community.hitachivantara.com/docs/DOC-1009855)注:7.1版本
使用:
1.解压后直接使用
2.
这里启动可能会很慢,请耐心等待
3.注释:连接是7.1的版本,我这里截图是8.3的,后面的博客会持续更新。
到达这一步就恭喜你,成功启动kettle了
预告:下一篇我将给kettle基本使用及其简单组件使用整理