需求:
已交付的报表,客户提出了更新要求:将一个已出售的业务部门(HC)的数据排除掉。
解决方法:
1. 查看当前数据集的来源(SQL脚本)
2. 在SQL脚本中查看源数据表中是否包含“业务部门”这一字段,很遗憾,没有
3. 继续追查上一级源数据表(也就是数据集的祖父级数据表),很遗憾,也没有
4. 继续追查上上一级源数据表(也就是数据集的曾祖父级数据表),不错,该数据表中有一个源数据表,包含“业务部门”
5. 添加“业务部门”筛选条件,问题解决
备注:
这个需求涉及到了数据沿袭(Data Lineage)的概念。
Data lineage includes the data's origins, what happens to it and where it moves over time.Data lineage gives visibility while greatly simplifying the ability to trace errors back to the root cause in a data analytics process.