一般来说都是:源系统-->sga同构层数据-->数据清洗层-->中间层--->应用层。这就是根据一个主题,完成数据的集成、清洗、转换及其显示。
前两天接触到另外一条数据思路,那就是管理类思路,他记录的是数据质量的清单,管理数据质量。觉得这是一个很好的思路,能够将某个主题下比较重要的数据的数据质量管理起来,对于做数据仓库是一种提升。有些应用仅仅用于分析趋势,要求可以不那么严格,但是对于严格统计意义上的信息,要求就比较高,就需要对数据仓库中的数据质量进行严格要求。有的企业甚至会停工几个月,对于数据从源系统开始规范数据,进行严格的数据管理。
接触到的数据质量管理的 数据流向:源系统-->SGA同构层数据-->数据质量中间表-->数据质量报告