kettle组件-流程

1:空操作
   该操作什么都不做,主要作用是,想测试的时候充当一个占位符。
   例如:两个文本文件输入,同时连接到流查询步骤中,但是流查询仅仅能从一个流中查询信息,所以可以在同时连接流查询之前,
             将两个文本文件输入连接到空操作,然后再让空操作去连接流查询。
         空操作组件具有合并记录的作用。
2:过滤记录
   该步骤通过条件和比较符来过滤记录。
   发送ture数据给步骤:指定条件返回true的数据将发送到此步骤
   发送false数据给步骤:指定条件返回false的数据将发送到此步骤。
   true和false步骤必须指定。
 条件:
        条件中可以字段和字段间进行比较,也可以字段和某一固定的值进行比较。
        条件一开始的NOT选项是干什么?
3:追加流
   这个步骤将一个步骤中的数据流追加到另一个步骤中。
   前:待追加的数据流。
   后:追加到的数据流。
4:阻塞数据直到步骤都完成
   kettle中转换和作业的执行顺序----
   1:一个作业内的转换是顺序执行的。
   2:一个转换中的步骤是并行执行的。
   3:作业内不支持事务,转换内支持事务。
 根据业务需要,通常需要在转换内顺序执行,小技巧如下:
   1:执行sql是优先于所有步骤的。
   2:使用阻塞数据直到步骤都完成,确保其他数据步骤都完成再执行下一步。
 事务:
   1:设置转换只使用一个事务。转换设置---》杂项---》使用唯一连接
   2:设置转换内的表插入等数据库操作不进行批量提交。“提交记录数量”--》0
 阻塞数据直到步骤都完成:
   当抽取10个表数据的时候,我们希望先抽取小表,然后最后再执行大表。但是kettle转换的步骤是并行执行的,
  这样有可能会出现报错,比如经常报“数据连接异常关闭”等报错,并行执行会消耗大量资源,也会导致抽数的
  时候抽到一半未成功的情况。 这时我们就可以使用kettle的阻塞数据直到步骤都完成 来设计数据表的抽取。
  当执行完ods_dept步骤的时候,才去执行ods_BONUS步骤,然后再ods_BONUS步骤完成后才去执行ODS_EMP步骤。
 组件介绍:
   监视下面的步骤----》步骤名称表示需要等待执行完成的步骤名称。
 
 
 
 
 

转载于:https://www.cnblogs.com/zja001/p/10084451.html

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
kettle9是一个数据集成和ETL工具,由Kettle项目开发而来。它提供了可视化的界面,使用户能够通过简单的拖拽和配置来设计数据转换和处理的工作流程Kettle9支持多种类型的数据源,包括关系型数据库、文件、Web服务等,可以方便地对数据进行抽取、清洗、转换和加载等操作。 而kettle-scheduler是基于Kettle9的调度器组件,它提供了一套功能丰富的调度管理和监控机制,可以用于定时执行和控制Kettle9的作业和转换任务。通过kettle-scheduler,用户可以灵活地设置作业的运行时间、频率和触发条件,也可以监控作业的执行状态和运行日志。 kettle-scheduler的核心功能包括以下几个方面: 1. 作业调度管理:kettle-scheduler可以根据用户的需求,设置和管理Kettle9作业的调度计划,包括作业的触发时间、频率、依赖关系等。用户可以设定一次性的任务,也可以设置周期性的任务,以满足不同的业务需求。 2. 作业监控和报警:kettle-scheduler可以实时监控作业的执行状态和运行日志,当作业运行出现异常或错误时,可以及时发送报警通知给相关人员,以便及时处理和修复。 3. 作业并发控制:kettle-scheduler可以设置作业的并发执行数量,以控制任务的同时运行数量,避免资源的过度占用和冲突。 总之,kettle9和kettle-scheduler是一套强大的数据集成和调度管理工具,能够帮助用户更高效、灵活地处理和管理数据任务,提高数据的处理效率和准确性。同时,它的可视化界面和丰富的功能也使得用户操作起来更加简单和便捷。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值