[原创]-数据仓库ETL开发

本文详细介绍了数据仓库ETL的开发过程,包括STG层、ODS层、DW层和DM层的主要步骤,以及ETL优化方法。ETL是数据仓库后台的重要组成部分,涉及数据抽取、清洗、规范化和提交等环节,旨在降低开发成本、便于管理,并确保数据质量。
摘要由CSDN通过智能技术生成

ETL开发

概述

ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统数据仓库一般分为四层模型。

分层的作用:

1.划分ETL阶段工作重心,便于管理

2.降低开发和维护成本

3.减少需求变化带来的冲击

4.便于数据问题跟踪

名词解释:

  • ODS——操作性数据

  • DW——数据仓库

  • DM——数据集市

STG层

在维度建模阶段已经确定了源系统,而且对源系统进行了数据评估。STG层是根据CDC策略把各个源系统的数据抽取到数据仓库中。STG层主要是面向批处理的形式,如果是根据日志信息实时同步,可以跳过STG层直接进入ODS层。

STG作用: 减轻源系统压力;数据备份,支持重跑;便于问题跟踪;数据质量检查&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值