ETL测试参考文档

ETL测试参考文档

 

本文档主要介绍ETL测试的流程,以及一般的项目情况来说明ETL的测试方法。

ETL测试流程图

测试环节

1、 需求分析

熟悉业务流程和业务规则,根据需求分析出源表与目标表以及之间的mapping关系,解析出业务的数据流图:

1、 测试分析

测试点:

ETL常规检查:

1.ETL脚本是否有运行错误,脚本运行时间(看执行计划)

2.ETL脚本的错误处理机制是否完整(代码review)

3.ETL脚本是否支持回滚

业务逻辑检查:

1.数据量的检查。核对记录数是否和预期一致

2.唯一性检查。

  主键是否重复(cookie_id,member_id是否重复)

3.业务字段转换正确性检查。指标计算是否正确.抽样检查。

  源表和目标表各取一定数量记录,判断字段映射是否正确(映射字段)。

  指标计算是否正确(指标计算字段)

4.随机性验证(随机取几条数据,看是否有乱码,异常数据等。

 

测试重点

项目中的关键业务,复杂逻辑部分作为测试重点

用例划分说明:

按每个指标设计用例。

测试策略:

测试策略:增量测试(逐步提交测试)

测试方法:基于查询的测试(预期结果基于sql来展现,做到数据变化,结果不变。另外便于回归)

2、 标准数据集构建

造数据分2个方面,1个是直接抽取线上的数据1个是用脚本造异常数据。

3.1 利用dblink抽取线上的数据。抽取线上数据时,需要注意,测试数据的全面性。即测试数据全面覆盖。比如sex字段,在抽取线上数据时,需要抽取到malefemale情况,而不能仅仅是malefemale,这样测试数据就会缺失。对于有关联的表进行数据抽取时,可以先抽取主表,然后根据主表的数据有条件的抽取子表。

3.2 造异常数据,异常数据可以从下面几个方面进行考虑:字段类型、字段长度、空值、业务异常值、唯一约束值

3、 测试用例设计

测试用例可以单独设计,也可以采用调度的思想进行设计,采用调度方法进行设计时,能一次验证多个用例,另外也方便回归。这里说一下调度思想的测试用例的设计思路。

设计思路:

总调脚本:

CREATE OR REPLACE PACKAGE BODY PKG_KPI_TC IS
    PROCEDURE SCHEDULER(
 
/*********************************************************************
  *parameter:
  *authoer XIANGMIN.MENGXM
  *time 2009-6-26
  *
  *********************************************************************/

  P_DATE IN DATE DEFAULT TRUNC(SYSDATE))
  IS
  V_DATE               DATE := TRUNC(P_DATE);
  BEGIN
    DELETE FROM test_map WHERE yyyymmdd = v_date;
    COMMIT;--
调度之前先清空测试表
    REF_KPI_TC_001(v_date);--
用例1
    REF_KPI_TC_002(v_date);--
用例2
         END;
END PKG_KPI_TC;


测试用例1

CREATE OR REPLACE PROCEDURE REF_KPI_TC_001(P_DATE IN DATE DEFAULT TRUNC(SYSDATE)) IS
  V_id         NUMBER;
  V_DATE           DATE := TRUNC(P_DATE);
  BEGIN
SELECT
 a.id into v_id FROM  src_a;

INSERT INTO test_map(YYYYMMDD,id,x) VALUES(v_date,v_id,x);
  COMMIT;
END;

 

1、 测试结果验证

Exec procedure_();--得出被测脚本的结果

Exec REF_KPI_TC_001();得出测试结果

 

结果验证:

第一步先验证记录数是否一致,如果记录数不一致,则一定存在问题,检查问题,找出原因。

第二步在记录数一致的情况下,检查值是否正确。

方法1:巧用minus

SELECT * FROM target_a
MINUS
SELECT
* FROM test_map;

--注意,此处一定要调换2个表的位置进行比较。Minus函数在进行比较时,以第一张表为准,找出第一张表中与第二张表不一致的地方。即:找出sumdt0表中与map表不一致的结果

方法2:写脚本进行验证

2、 发布后

在相关平台观察数据趋势,数据监控。项目发布后,我们可以观察数据的波动趋势,一般来说数据的波动是在一定范围,遵循一定原则的,如果发现数据波动超出了预计范围,这个时候就需要特别注意了。

 

 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值