本发明涉及计算机领域,尤其涉及一种数据仓库内表格的血缘关系追溯的方法和装置。
背景技术:
在使用数据仓库时,用户需要了解他所使用的表格的来源。在更新数据仓库表格时,开发人员也需要确定他做的修改操作会影响上下游的哪些表格。因此就需要一个数据仓库血缘关系服务来解决这些问题。
传统的数据仓库血缘关系需要依靠数据仓库开发人员手动维护一个表格,工作量极大,并且随着数据仓库的修改需要手动更新,容易出现错配漏配情况。
技术实现要素:
为了解决现有技术中数据仓库血缘关系的人工维护,会出现效率慢,易出错的问题,本发明提供一种数据仓库内表格的血缘关系追溯的方法和装置。
第一方面,本发明提供一种数据仓库内表格的血缘关系追溯的方法,该方法包括:
读取各表格的生成方式;
根据各表格的生成方式,利用其对应的解析工具解析表格内容;
利用脚本语言读取表格内容,确定各表格上下游血缘关系。
进一步地,该方法还包括:
利用渲染工具,绘制各表格上下游血缘关系。
进一步地,读取各表格的生成方式包括:
读取使用数据仓库工具生成的数据库表格、读取使用大规模数据处理计算引擎生成的数据库表格。
进一步地,利用脚本语言读取表格内容,确定各表格上下游血缘关系包括:
删除根据数据仓库工具生成的数据库表格内的临时表,确定各表格上下游血缘关系。
第二方面,本发明提供一种数据仓库内表格的血缘关系追溯的