ETL
钛合金编程
静以修身,俭以养德!The greatest thing is, at any moment, to be willing to give up who we are in order to become all that we can be.
展开
-
Kettle调度和监控
Kettle调度和监控的理论知识介绍,具体类容如下:1 调度 在这个指导文档中,主介绍两种类型Kettle任务和转换的调度方式。Ø 操作系统级别的调度器:对于ETL来说,调度不是独一无二的。这是操作系统能够提供标准调度的一般性需要,如UNIX衍生系统上的Cron以及Windows系统上的任务调度器。这些调度器能够拥戴调度Kettle命令行程序来运行任务和转换。Ø原创 2013-07-06 22:43:08 · 23001 阅读 · 2 评论 -
在浏览器中执行Kettle job或者transformation
通过URL执行Kettle的转换或者任务,这个功能可以Kettle的web service。假如有这样的一种情形:第三方想从你这里读取数据,然而,你又不要写web service代码。任何人都可以从web service中读取数据,Kettle也提供了这样的功能。下面的这里例子展示了这个功能。 1. 组件连接图,创建这个transformation. 2.原创 2013-07-07 11:12:13 · 5926 阅读 · 1 评论 -
Kettle 简介和实例
1.1 基本概念 Kettle 是”Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取、转换、装入和加载数据;翻译成中文名称应该叫水壶,名字的起源正如该项目的主程序员MATT 在一个论坛里说的哪样:希望把各种数据放到一个壶里然后以一种指定的格式流出。Spoon 是一个图形用户界面,它允许你运行转换或者原创 2013-07-06 22:21:18 · 3621 阅读 · 0 评论 -
Kettle(Pentaho DataIntegration)实现Hadoop-2.2.0 文件复制
这个实例很简单,难点在于你的Hadoop2.20插件的安装(我的上一篇博文)。实现的步骤如下: 1. 创建job 创建一个Kettle的job,实现如下效果。原创 2014-01-22 22:33:56 · 3449 阅读 · 0 评论 -
Kettle(Pentaho DataIntegration) 安装Hadoop-2.2.0插件
1 安装前的准备工作 1.1 Pentaho Data Integration当前的CE 版本Pentaho Data Integration 是5.0.1,下载地址:http://www.pentaho.com/download/。你也可以尝试企业版EE,这里不做介绍了。下载完成后,压缩到指定的目录下。 1.2 Hadoop 2.2.0下载最新稳定版本的Hadoop原创 2014-01-22 22:18:55 · 7994 阅读 · 11 评论