【架构】数据积存功能之 ODS 层

本文探讨了数据仓库中操作数据层(ODS)的角色,强调其作为历史数据积存的功能。ODS层在保留原始数据的同时,添加如update_time, from和update_type等字段以辅助数据管理。虽然ODS层原则上不修改数据,但在处理业务系统对历史数据的低频查询和修改时,采取追加更新的方式,update_type标记数据状态。数据更新分为全量和增量导入,通常使用外连接和全覆盖方法处理增量数据,确保与业务系统保持一致。" 8939953,167005,使用VBS通过WMI遍历注册表,"['VBS编程', 'WMI接口', '系统管理', '注册表操作', 'Windows脚本']
摘要由CSDN通过智能技术生成

操作数据层 ODS

在数据仓库的整体架构中讲到,ODS 层的数据需与原业务数据保持一致,且不允许修改,从而完成历史数据积存的功能。

数据管理

但在实际企业开发中,ODS 层的数据是原始数据的一个扩充集,在保留所有原始数据的情况下,会增加一些字段用来进行数据管理。

如下图所示,为表增加 update_time 字段标识数据进入数据仓库的时间,from 字段标识数据的源系统,update_type 字段标识数据的更新类型。

不过 ODS 层不是不允许数据修改吗?怎么会出现 update_type 属性呢?其实 ODS 层的数据在第一次进入数据仓库时,即通过 ETL 流程导入后,数据的 update_type 统一为 INSERT。但 ODS 层积存了历史数据后,业务系统会定期清理这些已经存储到数据仓库的历史数据,从而保证业务系统的性能;于是业务系统对历史数据低频率的查询、修改,就落到了数据仓库中,而 ODS 层不允许被修改,所以需要将修改的数据查询出来,修改后以追加的形式追加到 ODS 层中,此时这条追加数据的 update_type 就变为 UPDATE,标志着是后期被业务系统更改的数据。

数据更新

在数据仓库中,业务数据定期会通过 ETL 流程导入到 ODS 中,导入方式有全量、增量两种。

数据第一次导入时,会选择全量导入。数据非第一次导入,每次只需要导入新增、修改的数据;新增的数据可以直接追加ÿ

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

桥路丶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值