【Kettle】血统分析

在转换中,血统就是说你要知道一个数据是从哪里来的,在哪个步骤中,增加了或修改了这个数据,最后输出到哪个数据库表中。

本篇通过job,先把资源库导出成xml文件,然后通过分析xml文件,把想要的信息输入到数据库表中进行保存。当要查询表来源时,只需要查询存储资源库的表即可。

job:

job中的转换:

1. 导出资源库到XML文件

2. Get data from XML(解析导出的资源库XML文件)

输出的字段名如下,其中“.”表示在“内容”标签中设置的循环路径:

transname(转换名称):./info/name

step_name(步骤名称):./step/name

step_type(步骤类型):./step/type

database(连接的数据库):./connection/name

tablename(输出的表名):./step/table

schema(表所在的schema名):./step/schema

sql(生成表的SQL):./step/sql


3. 表输出


  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很高兴回答你关于Kettle源码的问题。Kettle(也称为Pentaho Data Integration)是一款开源的ETL(Extract, Transform, Load)工具,用于数据集成和数据处理。 Kettle的源码可以在其官方网站或GitHub上找到。它是使用Java编写的,主要由一些核心模块和插件组成。核心模块包括了转换引擎、元数据管理、作业调度和用户界面等关键功能。 转换引擎是Kettle的核心部分,负责执行ETL转换过程。它定义了一些基本的元素,如步骤(Step)、作业(Job)、转换(Transformation)等,并提供了处理数据流、执行任务和错误处理等功能。 元数据管理模块用于管理Kettle的元数据,包括数据库连接、数据源定义、字段映射等。它提供了对元数据的增删改查操作,并与转换引擎进行交互,以实现数据的读取、转换和存储。 作业调度模块用于管理Kettle作业的调度和执行。它支持定义作业间的依赖关系,可以定时触发作业执行,还可以监控作业的执行状态和结果。 用户界面模块提供了图形化界面,用于配置和管理Kettle的各个组件。用户可以通过界面进行转换和作业的设计、调试和执行,还可以查看日志和统计信息等。 除了核心模块,Kettle还支持插件机制,允许开发人员根据需要扩展Kettle的功能。插件可以包括新的输入输出组件、转换步骤、作业脚本等,开发人员可以根据自己的需求进行定制。 总结起来,Kettle的源码分析涉及到核心模块的工作原理、元数据管理、作业调度和用户界面等方面。通过深入研究源码,你可以了解Kettle是如何实现数据集成和处理的,从而更好地使用和定制这个强大的工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值