kettle 使用基础

ETL 工具

ETL工具:kettle、informatica、datastage、ogg+odi(oracle数据库自带)、ssis

  1. 资源库:程序包,打包程序,整体迁移备份
    文件资源库(元数据 = 描述数据的数据)
  2. 数据库:连接数据库,可以获取里面的表数据
  3. 转换:mapping抽取数据 + 添加字段(抽取数据)
  4. 作业:工作流、job、调度(作业调度定时自动抽取数据)
    把kettle里开发的转换 串联或者并联 调度执行,自动化(定时) T+1 M+1 实时
  5. 日志监控
     

一、kettle介绍

什么是 Kettle

Kettle 是“Kettle E.T.T.L. Envirnonment”的缩写。

用来实现:抽取、转换、装入和加载数据。 = ODS层同步传输
Spoon 是 Kettle 的图形设计用户界面,允许你运行转换或者任务
其中转换是用Pan 工具来运行,任务是用 Kitchen 来运行。Pan 是一个数据转换引擎,它可以执行很多功能。

从不同的数据源读取、操作和写入数据。Kitchen 是一个可以运行利用 XML
或数据资源库描述的任务。通常任务是在规定的时间间隔内用批处理的模式自动运行。

 运行 Spoon

不同的平台上运行 Spoon 所支持的脚本:
Spoon.bat: 在 windows 平台运行 Spoon。
Spoon.sh: 在 Linux、Apple OSX、Solaris 平台运行 Spoon。

二、数据库连接(Database Connections)

资源库

一个 Kettle 资源库可以包含那些转换信息,这意味着为了从数据库资源中加载一
个转换,则必须连接相应的资源库。
要实现这些,需要在资源库中定义一个数据库连接,可以在 Spoon 启动的时候,利
用资源库对话框来定义。

配置环境变量

JAVA_HOME(JDK的安装路径):
C:\Program Files (x86)\Java\jdk1.8.0_25

classpath:
      .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;

path:
      ;%JAVA_HOME%\bin;

创建资源库

1. 创建新资源库

在这里插入图片描述

 2. 选择数据库连接方式

 3. 新建数据库连接

创建或更新后执行

在这里插入图片描述

 4. 连接资源库

自己写好id名字(aa),连接资源库
密码admin

在这里插入图片描述

 

 三、抽取转换

先全量抽取,再增量抽取(以T+1的方式)

表输入表输出

  1. 创建两个DB连接
    源层 贴源层

  2. 表输入
    源层
    选择要输入的表
    在这里插入图片描述

     to_char(sysdate-1,‘yyyy-MM-dd’) 前一天

  3. 表输出
    贴源层
    在这里插入图片描述 

  4. 连接表输入表输出
    从源层传到贴源层
    在这里插入图片描述 

  5. 记得保存

执行sql语句

删除表里数据,重新全部插入

在这里插入图片描述

 在这里插入图片描述

 SQL转Excel

  1. 新建一个转换,创建一个表输入
    如果有日期类型,要提前转换to_char
  2. 创建一个Excel输出
    选择存放位置和名字,并获取字段
    在这里插入图片描述
  3. 保存执行

Excel转SQL

创建Excel输入
选择要用的文档添加,并添加字段

 

  1. 创建Excel输入
    选择要用的文档添加,并添加字段
    在这里插入图片描述
  2. 创建表输出
    选择用户和要用的表
    在这里插入图片描述
  3. 输入字段映射
    无法匹配的=生日 手动添加
    选中两个对应字段添加
    在这里插入图片描述
  4. 添加一个组件
    字段选择
    在这里插入图片描述
    在这里插入图片描述

 四、作业

实现作业自动化 、T+1等

 转换

  1. 选择文件新建一个作业
    在这里插入图片描述

  2. 选择转换
    在这里插入图片描述

  3. 定时
    每一分钟执行一次
    在这里插入图片描述

  4. 保存运行

作业调度

在这里插入图片描述

 

给要用的表按照需求创建转换并对应好

  1. 并联关系 = 同时执行
    start右键 --> launch next entries in parallel 实现并联
    在这里插入图片描述

  2. 串联关系 = 一个一个执行
    在这里插入图片描述

调用存储过程

在这里插入图片描述
创建一个转换,调用存储过程
在这里插入图片描述

带参数

在这里插入图片描述

  1. 添加字段
    第一行=命令行1
    在这里插入图片描述
  2. 获取刚刚字段
    在这里插入图片描述
  3. 选择要调用的存储过程
    在这里插入图片描述
  4. 保存执行,写参数
    在这里插入图片描述

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle是一款国外开源的ETL工具,它可以在Windows、Linux和Unix上运行,用于高效稳定地进行数据抽取。Kettle的中文名称是水壶,该项目的主程序员MATT希望将各种数据放入一个壶中,并以指定的格式输出。Kettle提供了一个图形化的用户环境,让用户描述想要做什么,而不是如何做。Kettle中有两种脚本文件,分别是transformation和job,transformation用于完成针对数据的基础转换,而job用于完成整个工作流的控制。\[1\] 关于Kettle使用教程,可以参考以下步骤: 1. 下载和安装Kettle:你可以从Kettle的官方网站下载最新版本的Kettle,并按照官方提供的安装指南进行安装。 2. 学习Kettle的基本概念:了解Kettle的基本概念,如转换(transformation)、作业(job)、步骤(step)等,可以帮助你更好地理解和使用Kettle。 3. 学习Kettle的图形化用户界面:熟悉Kettle的图形化用户界面,学习如何创建和编辑转换和作业,以及如何配置各种步骤和连接。 4. 学习Kettle的数据抽取和转换:了解如何使用Kettle进行数据抽取和转换,包括连接到不同类型的数据库、执行各种数据转换操作等。 5. 学习Kettle的调度和监控:了解如何使用Kettle进行作业的调度和监控,包括设置作业的定时执行、监控作业的执行状态等。 6. 学习Kettle的插件开发:如果需要连接特定的数据库或实现其他自定义功能,可以学习如何开发和使用Kettle的插件。 总之,学习Kettle使用教程需要从基础概念开始,逐步学习和实践。你可以通过官方文档、在线教程和社区论坛等资源来获取更多关于Kettle的学习资料和帮助。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [kettle教程(1) 简单入门、kettle简单插入与更新。打开kettle](https://blog.csdn.net/weixin_30859423/article/details/95025282)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [kettle使用教程(超详细)](https://blog.csdn.net/z69183787/article/details/125855700)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值