数据验证总结:
(1)数据统计数量跟api对不上,检查统计数据的逻辑,union和union all会导致有的数据(除了公司名,其他字段都为null)只会保留一条,虽然他们能保证(由公司名,其他字段不全为空)这种数据去重;还有一个诀窍看,基于时间节点统计数据,比如执行,他只能基于执行时间统计执行与否及执行次数,那么最好从基础表里看一下是否执行的基础表里面执行时间字段有为null的,如果没有,后面主体公司合并得到的关联公司,join执行表得到的执行时间字段为null的话,就不应该统计在执行事件内,因为,该公司根本没有执行记录,;这种情况与裁判文书次数情况不同,裁判文书次数统计还基于case_type进行统计,属于原告\被告\其他三种类型(处理过的)就表示由裁判文书发生;(注:经数据库验证,现在数据库里面基本上执行\法院公告\裁判文书时间字段都不为空啦!!!);;;;;
数据仓库验证情况总结:
遇到有跟api不一致的,首先看得到该数据的子表,子表数据的情况是否大致符合,然后验证逻辑.一步一步验证是否是想要的结果,有的时候要头脑清醒,对一些地方,左列公司名跟右列公司名不要搞混,注意join的逻辑;
数据验证
最新推荐文章于 2024-03-09 15:54:12 发布