数据抽取-全量抽取、增量抽取

原文参考链接连接数据 - 数据抽取 - 《有数BI用户手册》 (163.com)

1. 概述

本产品提供了两种数据连接方式,直连和抽取。直连是指直接连接用户数据库进行数据的读取,而抽取则是将表数据抽取到本产品的MPP数据库中,提升查询效率。本文将对数据抽取功能进行详细介绍。

2. 数据抽取的类型

数据抽取分为全量抽取、增量抽取两种抽取方式。

2.1 全量抽取

每次抽取的时候将表数据全部抽取至MPP数据库,提供了全量覆盖抽取和全量追加抽取两种抽取方式。

  • 全量覆盖抽取:每次抽取,对数据库的全部数据进行抽取,并覆盖MPP数据库已有的数据,如下图所示:

    chouqufangshi1.jpg

  • 全量追加抽取:每次抽取,对数据库的全部数据进行抽取,并追加在MPP数据库中,如下图所示:

    chouqufangshi2.jpg

2.2 增量抽取

每次只抽取相比于上次更新增加的数据,提供了增量抽取和增量抽取(滚动覆盖)两种抽取方式

  • 增量抽取:每次抽取,根据增量字段判断数据库中的数据是否为新增数据,对数据库的新增数据进行抽取,并追加在MPP数据库中,如下图所示:

    chouqufangshi3.jpg

  • 增量抽取(滚动覆盖):每次抽取,根据日期及滚动周期将数据库中的新增以及部分历史数据抽取到MPP数据库中,其中历史数据将会覆盖原数据。

    chouqufangshi4.jpg

关于增量抽取,需要注意的是:

  • 只支持针对日期型(Date)和数值型(Int)的字段作为增量抽取的依据字段;
  • 只支持对源表新增的数据做增量,如果源表中对数据有更新或删除操作,增量抽取的时候不会检测到这些变化;
  • 支持以字符串作为抽取依据,如自增ID。
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值