有一些企业对这个问题的概念很模糊,认为目前的数据规模很小,人为可控,暂时不需要做数据治理。
但是在实际使用中还是会遇到很多问题:
- 数据监管力度不够,出现脏数据
- 数据体系逐渐规模变大,管理混乱
- 数据的血缘丢失,无法回溯旧、老的数据
无论企业的数据规模如何,我认为还是提起做好数据治理的规划。考虑到成本的问题,可以分阶段进行。
“
为什么要进行数据治理:
- 你的数据是否真的可用,缺失和异常值怎么办?
- 数据从哪里来到哪里去,血缘信息是否丢失
- 数据访问是否安全,明文标识还是加密?
- 新的数据加工参考什么规范,维度和标签管理是否存在标准?
”
有剑在手不用和无剑可用是两回事
。提前做好数据治理规划,会节省后续的改造成本,避免过程冗余重构或者推倒重来等情况的发生。
数据治理可以有效保障数据建设过程在一个合理高效的监管体系下进行,最终提供
高质量
、
安全
、
流程可追溯
的业务数据。