Kettle
kone666
这个作者很懒,什么都没留下…
展开
-
kettle转换实践(三)-含有参数传递的定时任务
1需求描述使用Linux中的CRONTAB调度kettle2 数据库环境DROP TABLE DB2INST1.TEST_1;CREATE TABLE DB2INST1.TEST_1 ( ID INTEGER, NAME VARCHAR (10), DATE VARCHAR(10) ) IN USERSPACE1;INSE...转载 2019-06-08 20:33:32 · 1541 阅读 · 0 评论 -
kettle转换实践(二)-合并记录
(1)合并记录步骤说明###旧数据来源:旧数据来源的步骤###新数据来源:新数据来源的步骤标志字段:设置标志字段的名称,标志字段用于保存比较的结果,比较结果有下列几种。1. “identical” – 旧数据和新数据一样2. “changed” – 数据发生了变化;3. “new” – 新数据中有而旧数据中没有的记录4. “deleted” –旧数据中有而新数据中没有的记录#...原创 2019-05-26 15:46:57 · 5169 阅读 · 0 评论 -
kettle转换实践(一)-排序记录,记录集连接,过滤记录
如果我们清洗的数据是多个维度的,那么很有可能对数据进行关联得到一张最终表进行分析。比如:回答集合的数据里有如下字段:id,optionId,user。包含了谁回答了哪个问题,选项是什么。选项集合的数据里有如下字段:id,question,option。我们最终希望得到的数据集合是:id,question,option,user。那么就需要对两个集合进行关联新建流程如下:...转载 2019-05-26 15:40:13 · 2827 阅读 · 0 评论 -
Kettle代码解析
Kettle代码解析1.添加字段 /** * Adds <code>String</code> value meta with given name if not present and returns index * * @param rowMeta * @param fieldName * @return Index in row...原创 2019-12-18 13:27:49 · 474 阅读 · 0 评论 -
Kettle中如何调试插件
How to debug a Kettle 4 plugin IntroductionSince version 4 of Pentaho Data Integration the class path is no longer being scanned for classes that are annotated as a plugin. Only those jar files...转载 2018-11-16 10:43:41 · 1941 阅读 · 0 评论 -
Pentaho Data Integration (Kettle) step插件开发
一,开发环境搭建1,kettle源代码因为kettle开发文档支持有限,所以必须有一份源码备查。源码地址:https://github.com/pentaho/pentaho-kettle选择8.0版本,下载zipkettle需要jdk 1.8以上版本,maven3.0以上版本,并且在maven的conf/settings.xml中添加以下配置:<profiles&...转载 2018-11-04 16:59:47 · 692 阅读 · 1 评论 -
Kettle与java项目集成
1.上篇文章已经讲到,怎么新建一个转换,当然,那只是很简单的操作,下面我们将学习怎么将在kettle新建的转换或任务,放入到程序中,由程序调用执行首先,我们需要将kettle的jar包放入到程序的lib目录下,当然不只kettle包,还有其他一些重要的包。2.新建项目kettle ,我这里用来演示,3.kettle初始化代码(我这里执行和初始是分开的。。方便在次执行的时候不需要初始化)...转载 2018-11-02 17:48:11 · 8391 阅读 · 2 评论 -
使用Kettle API实现数据的迁移
利用kettle的api,将一个数据源中的信息导入到另外一个数据源中:package cn.com.saidi.job; import org.apache.commons.io.FileUtils;import org.pentaho.di.core.KettleEnvironment;import org.pentaho.di.core.database.DatabaseMeta...转载 2018-11-02 09:56:19 · 1515 阅读 · 1 评论 -
kettle 插件开发以及常用的接口和对象
1. kettle插件开发的四个常用的接口介绍1.1 转换步骤插件开发至少需要实现 四个接口: 1)StepMetaInterface:该接口主要是针对元数据的处理,加载xml文件,校验,主要针对一个步骤的定义基本 数据.在转换开始之前,kettle会调用init()方法。转换运行将仅在所有步骤从init()调用成功后才开 始。在步骤完成调用dis...转载 2018-11-02 09:45:20 · 737 阅读 · 0 评论 -
Kettle源码部署
https://blog.csdn.net/zutsoft/article/details/52998148转载 2018-11-02 08:50:40 · 480 阅读 · 0 评论 -
Kettle 7.1.0.0-12 安装版无法启动的问题
1.Kettle无法启动解决方法:只要修改一下spoon.bat里内存配置:if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms2058m" "-Xmx1024m" "-XX:MaxPermSize=256m"改为if "%PENTAHO_DI_JAVA_OPTIONS%"==&quo原创 2018-11-06 14:42:57 · 2819 阅读 · 0 评论 -
Kettle集群介绍及(Windows、Linux)环境搭建
一、Kettle集群概述1) Kettle集群简介 集群技术可以用来水平扩展转换,使得他们能够同时运行在多台服务器上。它将转换的工作量均分到不同的服务器上。一个集 群schema由一台主服务器,和一些子服务器组成,主服务器作为一个集群的控制器。简单的说,我们提到的Carte控制服务器 就是主服务器,其他的Carte服务器就是子服务器。2)Kettle集群的原理...转载 2018-10-31 15:47:39 · 1223 阅读 · 0 评论 -
将Carte部署为Windows服务
1. 为何需要部署成Windows Service如果以cmd命令行来启动Carte,如果开发者不小心将此命令行窗口给关闭了,那么Carte服务也会随之关闭。因此将Carte部署成Windows Service能够有效地防止开发者错误地将Carte服务给杀掉。配置成Windows服务形式能够让Carte开机自动启动。2. 目标将Carte部署成Windows Service,让Ca...原创 2018-10-31 11:13:44 · 688 阅读 · 0 评论 -
kettle转换之多线程
ETL项目中性能方面的考虑通常是最重要的,特别是所讨论的任务频繁执行,或一些列的任务必须在固定的时间内执行。本文重点介绍利用kettle转换的多线程特性,以优化其性能。 假设转换中的每个步骤已经设置成最快的执行速度并且调节性能至最佳,且再没有更多的性能提升空间。但是利用kettle的多线程特性仍然可能提升转换的整体性能。 调整队列大小 当尝试优...转载 2018-10-31 10:29:22 · 4103 阅读 · 0 评论 -
在kettle中使用java直接调用transformation、job文件执行
目前在做一个项目,需要用到数据清洗,因为kettle是开源的,所以就选择了它。目前遇到的困难是,在创建好转换(transformation)或任务(job)后,需要集成到java代码中,以便和其他功能结合。由于网上很多例子的kettle版本是4.x以及5.0左右的,而kettle 6.0版本较之前有了很大改动,这些java代码已经不适合用于kettle 8.0了。经过在网上查资料以及在论坛里查找资...转载 2018-10-31 10:27:46 · 1289 阅读 · 0 评论 -
在Windows下使用命令行调度存储在资源库中的KTR
描述:在Windows下使用BAT调度存储在资源库中的KTR准备环境:1.ktr文件(该KTR必须是存储在资源管库中的)2.bat文件@echo off D: cd D:\software\pdi-ce-5.4.0.1-130\data-integration\ Pan.bat -rep LJ -user admin -pass admin -dir / -tran...原创 2019-06-14 11:56:38 · 606 阅读 · 0 评论