Kettle (Pentaho Data Integration) 基本名词及含义
一、核心概念
1. 转换(Transformation)
- 定义:数据清洗与转换的最小执行单元
- 特征:
- 文件扩展名为
.ktr
- 由多个**步骤(Step)通过跳转(Hop)**连接
- 支持行级流式处理
- 文件扩展名为
- 示例:数据清洗、格式转换、数据合并
2. 作业(Job)
- 定义:工作流程控制单元
- 特征:
- 文件扩展名为
.kjb
- 由**作业项(Job Entry)**通过条件跳转连接
- 支持定时调度和异常处理
- 文件扩展名为
- 示例:ETL任务编排、邮件通知触发
二、组件类名词
1. 步骤(Step)
- 定义:转换中的基础处理单元
- 分类:
类型 示例<