kettle数据采集三大流程-对账采集

文章详细介绍了Kettle数据采集的对账流程,包括设置变量、循环对账和核心对账步骤。强调了确保新数据源与医院数据一致的重要性,以及在处理中采用插入更新来处理同步错误。同时,建议设置并发数为2,但提交数量改为1以降低锁表风险,保持字段类型一致以提升效率。文章还提醒注意主键处理、机构限制以及错误日志记录,以防止数据错误和流程中断。
摘要由CSDN通过智能技术生成

kettle数据采集之对账流程配置

1、对账流程主入口

2、设置变量

3、进行循环对账

4、获取变量并执行各张表对账流程

5、核心对账流程

重点需要说明注意的:

        0、合并记录:平台要保证与医院的数据一致呀,新数据源一定是医院端的

        1比原来多了个插入更新,目的是为了解决数据同步报错后,继续执行更新操作,保证目标库数据与源库数据一致,不会终止项目运行

        2、设置了并发数为2,建议设置并发后,将提交数量改为1,降低因并发导致锁表风险,提高插入效率。

        3获取字段的时候,最好元数据这块加在字段类型,与目标库类型必须保持一致,目标表直接复制源表的即可,因为必须保持两边顺序、数据类型一致,这样可以提高数据采集效率。

  注意:如果目标库对应表的主键类型是NUMBER数值类型,SQL语句中必须使用TO_NUMBER()函数转换一下。

        4、主键值下面要选择N,表示不需要更新,避免主键包含索引,提高更新速度。

        5、目标表为多家医院时,一定注意加上机构限制,保证源表目标表拿出的数据来源是一致的,一定务必注意!!!,否则会删除目标表其它家医院的数据。

        6、增加了执行SQL脚本,记录执行错误的日志,便于后期查询及避免单条数据错误,导致对账流程终止。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值