关于数据类项目以及报表项目的测试,最大的难点以及痛点在于最后数据的准确性验证。
结合之前自己后台数据仓库的测试,总结一下对于数据类项目的测试注意事项
1.尽量以生产实际数据(敏感字段做脱敏处理)进行测试验证。生产数据会有各种异常值,测试的时候更能发现问题。比如客户信息表中的电话号码,中间会有以空格、逗号、横线分隔,开头会有0、+86的数据等异常值,测试的时候应该关注对这些异常值的处理。
2.尽量连续多天数据进行测试。数据后台类项目测试,很多汇总数据是需要T+1跑批生成,连续多天数据进行测试可以容易发现脚本中的取数条件问题。通常脚本中都会限定取当天的数据进行加工,如果漏掉了这个限制条件会导致数据量翻倍。
3.关联条件的问题。重点关注多表关联条件,关联条件是否满足业务口径的统计粒度,是否会导致数据发散问题。
测试检查点:
1.跑批检查。检查脚本跑批不报错、没有语法问题。
a.建表语句ddl
d.逻辑加工脚本sql
2.PK主键唯一性检查。防止重复数据的产生,如果没有物理主键,也应该检查逻辑主键。
select count(1) cnt from table where group by pk1, pk2 having cnt > 1;
3.乱码检查。检查表中数据是否出现乱码等情况。
4.空值检查。检查表中字段是否会出现全部都是空值的情况。
5.字段长度精度检查。目标表的字段长度和精度应该兼容取数上游表的字段长度和精度,防止数据被截取。