数据分层测试

本文介绍了数据分层测试的思路,从ODS到ADS层,分别阐述了各层的关注点、测试方法和重要性。ODS层关注数据同步与结构一致性;DWD层涉及数据清洗与业务理解,测试结合白盒与黑盒;DWS层测试模型合理性,对未来的数据应用至关重要;ADS层基于需求文档测试;业务报表展示层则注重用户体验和功能测试。
摘要由CSDN通过智能技术生成
  最近几年主要做数仓、大数据、BI报表相关的测试,做的并不算太好,写写总结,也算是对自己工作的一个复盘和思路的梳理。

  先简单介绍下工作背景:某大型集团下养老险投管中心,主要是投资交易相关的数据,大数据部分只涉及离线数仓,不涉及实时数仓。

  无论是之前基于Oracle的传统数仓还是后来基于Hadoop集群搭建起来的大数据仓库,数据处理的整体思路都是一样的。简单的来说就是从各个业务数据库对接业务数据,对数据进行ETL的过程,构建数据宽表,针对实际业务设计业务报表。

画个简单粗糙的数据流转图:
在这里插入图片描述
数据的分层测试:
从上面的流程图上可以看出,数据是一层层加工的,那测试也应该是分层的。
1、ODS层:业务数据同步到数仓,用的是DataX,数据保持和业务数据一致。故这一层主要关注表结构和业务数据库是否一致,数据同步逻辑是否合理,基本白盒即可。
2、DWD层,主要是通过SQL进行加工处理,对ODS层数据做一些简单的清洗,如丢弃一些垃圾数据,做一些数据格式的转换等,目的是提供干净的、和业务数据粒度一致的明细数据。
做这一层的数据测试时,需要了解业务数据的含义、业务数据的特点,哪些数据需要丢弃掉。很多时候,这一层的处理并没有明确的需求文档或者设计说明,需要测试人员自己主动去向上游业务系统的同事去了解并作出自己的判断。我一般会咨询上游的测试、运维、开发、产品同事,多问多沟通,再根据自己在上游数据库对数据进行的分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>