文章目录
数仓建模—初识数据治理
随着企业数据爆炸式增长,企业在用数时,会存在
- 数据孤岛问题、
- 数据建设不规范
- 指标口径不统一
- 数据查询计算不稳定
- 数据安全等问题。
因而各个公司也开始了数据治理,推动数据规范建设及使用。接下来我们将开启数据治理的系列篇,结合借鉴业界先进的数据治理经验及个人工作实践经历,帮助大家系统化地了解数据治理。
一、数据治理是干什么的
按照国际数据管理协会(DAMA)的定义,数据治理是对数据资产的管理活动形式权利和控制的活动集合(规划、监控和执行)。
按IBM的定义,数据治理是企业通过不同的策略和标准,提高组织数据的可用性、质量和安全性的一整套制度与管理活动,数据治理的目标是维护安全且易于访问的高质量数据,以获取更深入的业务洞察。
名词解释:
- 元数据:描述数据的数据,例如记录数据的存储位置、模型定义、血缘关系等信息,类似画像
- 主数据:描述企业核心业务实体的数据,例如客户、产品、账户等,主数据具有较高的业务价值,可在企业内跨各个业务部门被重复使用
数据治理要点是数据稳定、规范、安全,就像盖楼盘一样,需要设计好楼盘架构,打好地基,制定建设规范,并推动各团队人员进行搭建。