纯月部落

左手创新,右手敏捷,反过来可以么!

夏纯中ID:danny_xcz
843704次访问,排名40好友1人,关注者26
danny_xcz的文章
原创 298 篇
翻译 3 篇
转载 26 篇
评论 728 篇
纯月的公告
最近评论
lovedoghero:真是一种不错的生活方式。
yctcsms:哈哈,言之有理!
hfgayy:tag
quzhoushijie:gby企业管理
网站推广
打折机票
gby520
我爱你
Iloveyou
收藏
    相册
    Blog用途
    我的相册
    Java Desktop
    Open Source
    友情链接
    存档
    软件项目交易
    订阅我的博客
    XML聚合  FeedSky
    订阅到鲜果
    订阅到Google
    订阅到抓虾
    订阅到BlogLines
    订阅到Yahoo
    订阅到GouGou
    订阅到飞鸽
    订阅到Rojo
    订阅到newsgator
    订阅到netvibes

    原创 数据抽取技术大全--欢迎大家补充收藏

    新一篇: Google Earth的新功能 | 旧一篇: 如果QIR能够换回项目成功,我愿用一生敏捷

    数据抽取技术:

    1 静态数据捕获
      用于一、数据仓库初时化时,二、需要完全修改的数据

    2 增量数据捕获

        (1)# 通过交易日志,或数据库日志,包括诸如Oracle的Flashback query等日志捕获。可以使用 diff 工具帮助分析差异
        (2) 从数据库触发器中捕获:触发器将信息写在一张增量数据变化表内(包括删除的信息)。其它集成组件定期读取该表。
        (3) 基于日期和时间标记的捕获 / 类似的包括基于绝对自增id的捕获:无法解决删除问题
            Oracle 10g以上版本和MS-SQLServer类似,有一个rowVersion,也可做类似的时间标记
            如果某些源数据没有这些字段,那可以考虑再不破坏原有表的基础上增加一些上述的标记字段。可以先咨询源系统开发商。
        (4) 对于拥有集合运算函数数据库例如oracle拥有minus,可以根据一些主键做集合运算,将差异结果存到单独的表中供其它程序读取。
        (5)# 通过全表扫描比较来捕获:比较源数据的两个快照。当数据特别大时,性能成为问题。这是对于没有(3)中字段,且其它方法都不可

    用时候的最差选择。可以充分利用各种分段扫描算法。
        (6)# 从源应用程序中捕获:修改源应用代码

       (7)定制自己的jdbc驱动程序:法一,直接修改或重写驱动程序。法二,使用AOP技术对现有的驱动程序的接口进行weaver,对捕获的SQL进行分析处理。

    #表示通常很少使用

     

    欢迎大家补充。

    发表于 @ 2006年12月06日 12:30:00|评论(loading...)|编辑

    新一篇: Google Earth的新功能 | 旧一篇: 如果QIR能够换回项目成功,我愿用一生敏捷

    评论

    #CQ8587 发表于2007-02-27 18:30:16  IP: 220.202.38.*
    你好,我最近在做数据增量提取。想请教你一些问题。
    可以加我QQ吗?156013914
    谢谢!
    #herry0628 发表于2008-07-14 11:32:20  IP: 220.178.42.*
    USFINE.COM sell World of Warcraft gold and
    wow powerleveling sevise.
    发表评论  


    当前用户设置只有注册用户才能发表评论。如果你没有登录,请点击登录
    Csdn Blog version 3.1a
    Copyright © 纯月