PowerBI - 7.业务数据中心数据清洗工序

本文详细介绍了数据治理中的ETL过程,包括预处理、清洗、转换和目标数据装载。通过ETL工具如SSIS进行数据整合,强调了ODS库建设方法和数据质量检查的重要性,同时探讨了历史数据的冷处理策略,如外备和降级访问速度处理,以优化BI系统的性能。
摘要由CSDN通过智能技术生成

数据治理是将采集与汇聚的数据进行清洗、转换,生成可用的数据存入数据仓库中。
ETL逻辑结构按照处理过程可划分为ETL预处理、ETL转换清洗、ETL目标数据装载。对于数据提供者,包括业务系统以及管理系统,通过ETL预处理,数据装载入数据缓冲区。ETL转换清洗通过连接、合并、分割,按照清洗规则对数据缓冲区、数据存储区的数据进行加工、汇总,最终装载入数据存储区。
ETL预处理:
加载源系统数据,增加时间拉链,数据装载入数据缓冲区。对源数据做数据平衡检查、稽核数据有效性,报告数据质量问题。
ETL清洗:
对数据缓冲区数据标准化,统一数据表达格式,排序数据,筛选重复数据,合并或分割数据项,装载入数据存储区的基础数据层,报告数据转换清洗异常。
ETL转换:
对操作型存储区的贴源标准化数据,按照业务转换规则、通用数据清洗规则,加工数据,装载入数据仓库区的基础层。ETL3处理是耗时最长,逻辑处理最复杂的阶段,需要非常重视。
ETL再转换:
从数据仓库层进行适量的维度、指标建模。一些低粒度数据逐步向高粒度数据归并和汇总。
ETL目标数据装载:
提供数据存储区的层数据。本模式提供历史仓库允许的相应时间段的历史数据支持。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值