本文章参考Kettle的百度百科,网址:http://baike.baidu.com/link?url=eScVhxjYZ-nRLV4LIAGIrNcSZXBzG_gbD4K4GAWQjPmxNwvZEdFlmLBQUUaSaq6B-lN6oX5-UOMknJjXb4M9oK
Data Integration - Kettle
1 环境配置
java环境变量的配置
CLASSPATH= .;%JAVA_HOME%/lib/dt.jar;%JAVA_HOME%/lib/tools.jar
JAVA_HOME = C:\Program Files (x86)\Java\jdk1.6.0_24
PATH = %JAVA_HOME%/bin;%JAVA_HOME%/jre/bin
****java的安装,必须与对应的系统对照,如我的系统为win8 64,则应该下载64的jdk,否则会出现 Could not create Java Virtual Machine***
在系统的环境变量中添加KETTLE_HOME变量,目录指向kettle的安装目录:D:\kettle\data-integration
Kettle家族目前包含4个产品:Spoon、Pan、CHEF、Kitchen.
SPOON允许你通过图形界面来设计ETL转换过程;PAN允许你批量运行由SPOON设计的ETL转换。CEF允许你创建任务(Job)。
KITCHEN允许你批量使用由Chef设计的任务。
2 操作
在表输出中,如果流字段为空,则原因为连线没有激活。
把下面的线激活(点击一下即可),此时不为空了
名词:
1 ETL(Extract-Transform-Load)的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
2 EJB(Enterprise JavaBean)是sun的JavaEE服务器端组件模型,设计目标与核心应用是部署分布式应用程序。简单来说就是把已经编写好的程序(即:类)打包放在服务器上执行。凭借java跨平台的优势,用EJB技术部署的分布式系统可以不限于特定的平台
注:Integration整合,一体化,结合。 Data Integration数据一体化。