数据分层测试

  最近几年主要做数仓、大数据、BI报表相关的测试,做的并不算太好,写写总结,也算是对自己工作的一个复盘和思路的梳理。

  先简单介绍下工作背景:某大型集团下养老险投管中心,主要是投资交易相关的数据,大数据部分只涉及离线数仓,不涉及实时数仓。

  无论是之前基于Oracle的传统数仓还是后来基于Hadoop集群搭建起来的大数据仓库,数据处理的整体思路都是一样的。简单的来说就是从各个业务数据库对接业务数据,对数据进行ETL的过程,构建数据宽表,针对实际业务设计业务报表。

画个简单粗糙的数据流转图:
在这里插入图片描述
数据的分层测试:
从上面的流程图上可以看出,数据是一层层加工的,那测试也应该是分层的。
1、ODS层:业务数据同步到数仓,用的是DataX,数据保持和业务数据一致。故这一层主要关注表结构和业务数据库是否一致,数据同步逻辑是否合理,基本白盒即可。
2、DWD层,主要是通过SQL进行加工处理,对ODS层数据做一些简单的清洗,如丢弃一些垃圾数据,做一些数据格式的转换等,目的是提供干净的、和业务数据粒度一致的明细数据。
做这一层的数据测试时,需要了解业务数据的含义、业务数据的特点,哪些数据需要丢弃掉。很多

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值