数据治理方法论与相关面试题

在前几年大数据发展的初期,各个公司都在风风火火地搞平台,搞数仓,接入各种数据,在那个阶段注重的是数据的存储和计算,慢慢地一年一年的数据积累下来,数据量大了之后人们开始关注质量的问题,这也是数据治理这个词这几年变得非常火的原因,平台那一套东西已经很成熟了,基本上即插即用,能满足大部分不太刁钻的需求了。所以,现在各个企业都会把保证平台的稳定,保证数据的高质量放在第一位,毕竟用于指导决策的数据是不容许出现大错误的,所以数据治理也就成了数仓建设非常重要的一个环节。

本篇面试内容划重点:元数据管理、数据质量、数据安全。

 

元数据管理

元数据即数据的数据,数据仓库的特点是数据种类多、数量大,相应的元数据也有很多,如果没有一个集中管理元数据的地方,在使用上会非常不便。元数据可以说是数据治理的基础,基于元数据我们还可以做很多的相关应用,比如血缘分析、数据资产地图、数据质量管理等等。

元数据分为业务元数据、技术元数据和操作元数据,三者之间关系紧密。业务元数据指导技术元数据,技术元数据以业务元数据为参考进行设计,操作元数据为两者的管理提供支撑。

业务元数据

业务元数据是定义和业务相关数据的信息,用于辅助定位、理解及访问业务信息。业务元数据的范围主要包括

  • 指标名称、计算口径、业务术语解释、衍生指标等
  • 业务规则引擎的规则、数据质量检测规则、数据挖掘算法等
  • 数据的安全或敏感级别等

技术元数据

它可以分成结构性技术元数据和关联性技术元数据。结构性技术元数据提供了在信息技术的基础架构中对数据的说明,如数据的存放位置、数据的存储类型等;关联性技术元数据描述了数据之间的关联和数据在信息技术环境之

  • 4
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
数据治理框架是一个组织数据管理和数据治理过程的结构化方法。数据治理框架有助于确保数据的可靠性、一致性和合规性。在数据治理框架中,包括以下几个主要组成部分: 1. 数据战略:确定数据治理目标、数据政策和流程,明确数据的价值和用途,制定数据管理的策略和规划。 2. 数据质量管理:监控数据质量,确保数据的准确性、完整性和一致性。包括数据清洗、数据验证和纠错等控制措施。 3. 数据安全:保护数据的安全性,包括数据隐私保护、合规性要求和风险管理等方面的措施。 4. 数据架构:设计和管理数据的结构和组织方式,包括数据模型、数据仓库和数据集成等方面。 5. 数据访与共享:管理数据的访权限和共享机制,确保数据的合理使用和共享,同时保护数据的安全和隐私。 方法论是指在数据治理过程中采用的具体方法和技术。几种常见的数据治理方法论包括: 1. 元数据管理:通过记录数据的来源、定义和关系等元数据信息,帮助组织更好地理解和利用数据。 2. 数据标准化:制定和推行统一的数据标准,确保跨系统和跨部门的数据一致性。 3. 数据生命周期管理:管理数据的整个生命周期,包括数据的创建、存储、使用、归档和销毁等过程。 4. 数据治理流程和流程改进:制定和落实数据治理的具体流程和规范,并不断改进和优化数据治理流程。 通过建立数据治理框架和采用适当的方法论,组织可以更好地管理数据资源,提高数据的价值和利用率,降低数据治理的风险和成本,从而提升组织的业务决策能力和竞争力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老蒙大数据

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值