浅谈SSIS的增量抽取

本文探讨了在BI项目中ETL过程中的增量数据抽取,对比了同步日志、时间戳和读取时间段三种方法的优缺点。由于Oracle数据库的限制和客户对生产系统的影响顾虑,作者提出了一种基于SSIS的解决方案。通过创建时间控制表、数据源表和数据目标表,配合执行SQL任务和DataReader源,实现了通过时间变量筛选增量数据并将其加载到目标表的方法。
摘要由CSDN通过智能技术生成
  • ETL在BI项目中占据十分重要的位置,一般会占到整个工作量的80%,现在ETL增量方式大概有三种:同步日志,时间戳,读取时间段。首先客户大多数的业务数据库都是ORACLE,如果同步日志的话ORACLE必须开归档模式,日志是不准的。时间戳是个比较好的方法,但是你必须在客户的业务数据库里增加字段,为了加快访问速度,还必须建立索引,甲方一般都不能接受,他们不想影响他们的生产系统。SSIS的连接引擎存在好多bug,笔者在一个项目中,死活连接不上oracle 9I,当时检查了ORACLE的监听文件,什么都没有问题,还进行了从新配置,也没有连接上,最后是用DataReader数据源才行了
  • 怎么利用SSIS做增量呢,笔者介绍一种方法,大家可以在具体的项目中,灵活使用
  • 建立时间控制表、数据源表、数据目标表:

    -----------时间控制表
    create table bi_time(time datetime )

    insert bi_time
    select '2008-01-01'

    --------------数据源表
    create table bi_value (a int ,b datetime )

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值