作为数据分析师,充分认识业务数据流,可以大大提高数据分析效率。
1.什么是数据血缘管理?
数据血缘管理是元数据管理的重要组成部门,它描述数据的上下游关系。
按血缘对象来分,可分为系统级血缘、表级血缘、字段(列)级血缘。不管是结构化数据还是非结构化数据,都必定存在数据血缘关系。
2.数据血缘管理的意义?
数据的血缘对于分析数据、跟踪数据的动态演化、衡量数据的可信度、保证数据的质量具有重要的意义。
- 数据溯源。可帮助用户理解数据含义、在全流程上定位数据问题、进行数据关联影响分析等。对数据工程师和数据分析师都非常有用!
- 数据质量评估。
- 数据价值评估。数据血缘提供了一种基于数据实际应用的价值评估方法:使用者越多(需求方)、使用量级越大、更新越频繁的数据往往更有价值。
- 数据归档参考。通过了解数据被消费的情况,考虑进行归档或销毁处理。
3.数据血缘管理工具有哪些?
目前,市场上相关的管理工具非常多,有些是独立产品,有些则是集成产品中的一个功能模块。